Robo6log.ru

Финансовый обозреватель
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Факторный анализ главные компоненты

Факторный анализ. Метод главных компонент

В стремлении предельно точно описать исследуемую область аналитики часто отбирают большое число независимых переменных (p). В этом случае может возникнуть серьезная ошибка: несколько описывающих переменных могут характеризовать одну и ту же сторону зависимой переменной и, как следствие, высоко коррелировать между собой. Мультиколлинеарность независимых переменных серьезно искажает результаты исследования, поэтому от нее следует избавляться.

Метод главных компонент (как упрощенная модель факторного анализа, поскольку при этом методе не используются индивидуальные факторы, описывающие только одну переменную xi) позволяет объединить влияние высоко коррелированных переменных в один фактор, характеризующий зависимую переменную с одной единственной стороны. В результате анализа, осуществленного по методу главных компонент, мы добьемся сжатия информации до необходимых размеров, описания зависимой переменной m (m

Для начала необходимо решить, сколько факторов необходимо выделить в данном исследовании. В рамках метода главных компонент первый главный фактор описывает наибольших процент дисперсии независимых переменных, далее – по убывающей. Таким образом, каждая следующая главная компонента, выделенная последовательно, объясняет все меньшую долю изменчивости факторов xi. Задача исследователя состоит в том, чтобы определить, когда изменчивость становится действительно малой и случайной. Другими словами – сколько главных компонент необходимо выбрать для дальнейшего анализа.

Существует несколько методов рационального выделения необходимого числа факторов. Наиболее используемый из них – критерий Кайзера. Согласно этому критерию, отбираются только те факторы, собственные значения которых больше 1. Таким образом, фактор, который не объясняет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, опускается.

Проанализируем Таблицу 19, построенную в SPSS:

Таблица 19. Полная объясненная дисперсия

Как видно из Таблицы 19, в данном исследовании переменные xi высоко коррелирут между собой (это также выявлено ранее и видно из Таблицы 5 «Парные коэффициенты корреляции»), а следовательно, характеризуют зависимую переменную Y практически с одной стороны: изначально первая главная компонента объясняет 90,7 % дисперсии xi, и только собственное значение, соответствующее первой главной компоненте, больше 1. Конечно, это является недостатком отбора данных, однако в процессе самого отбора этот недостаток не был очевиден.

Анализ в пакете SPSS позволяет самостоятельно выбрать число главных компонент. Выберем число 6 – равное количеству независимых переменных. Второй столбец Таблицы 19 показывает суммы квадратов нагрузок вращения, именно по этим результатам и сделаем вывод о числе факторов. Собственные значения, соответствующие первым двум главным компонентам, больше 1 (55,246% и 38,396% соответственно), поэтому, согласно методу Кайзера, выделим 2 наиболее значимые главные компоненты.

Второй метод выделения необходимого числа факторов – критерий «каменистой осыпи». Согласно этому методу, собственные значения представляются в виде простого графика, и выбирается такое место на графике, где убывание собственных значений слева направо максимально замедляется:

Рисунок 3. Критерий «каменистой осыпи»

Как видно на Рисунке 3, убывание собственных значений замедляется уже со второй компоненты, однако постоянная скорость убывания (очень маленькая) начинается лишь с третьей компоненты. Следовательно, для дальнейшего анализа будут отобраны первые две главные компоненты. Это умозаключение согласуется с выводом, полученным при использовании метода Кайзера. Таким образом, окончательно выбираются первые две последовательно полученные главные компоненты.

После выделения главных компонент, которые будут использоваться в дальнейшем анализе, необходимо определить корреляцию исходных переменных xi c полученными факторами и, исходя из этого, дать названия компонентам. Для анализа воспользуемся матрицей факторных нагрузок А, элементы которой являются коэффициентами корреляции факторов с исходными независимыми переменными:

Таблица 20. Матрица факторных нагрузок

В данном случае интерпретация коэффициентов корреляции затруднена, следовательно, довольно сложно дать названия первым двум главным компонентам. Поэтому далее воспользуемся методом ортогонального поворота системы координат Варимакс, целью которого является поворот факторов так, чтобы выбрать простейшую для интерпретации факторную структуру:

Таблица 21. Коэффициенты интерпретации

Из Таблицы 21 видно, что первая главная компонента больше всего связана с переменными x1, x2, x3; а вторая – с переменными x4, x5, x6. Таким образом, можно сделать вывод, что объем инвестиций в основные средства в регионе (переменная Y) зависит от двух факторов:

объема собственных и заемных средств, поступивших в предприятия региона за период (первая компонента, z1);

а также от интенсивности вложений предприятий региона в финансовые активы и количества иностранного капитала в регионе (вторая компонента, z2).

Далее построим диаграмму рассеивания по первым двум главным компонентам:

Рисунок 4. Диаграмма рассеивания

Данная диаграмма демонстрирует неутешительные результаты. Еще в самом начале исследования мы старались подобрать данные так, чтобы результирующая переменная Y была распределена нормально, и нам практически это удалось. Законы распределения независимых переменных были достаточно далеки от нормального, однако мы старались максимально приблизить их к нормальному закону (соответствующим образом подобрать данные). Рисунок 4 показывает, что первоначальная гипотеза о близости закона распределения независимых переменных к нормальному закону не подтверждается: форма облака должна напоминать эллипс, в центре объекты должны быть расположены более густо, нежели чем по краям. Стоит заметить, что сделать многомерную выборку, в которой все переменные распределены по нормальному закону – задача, выполнимая с огромным трудом (более того, не всегда имеющая решение). Однако к этой цели нужно стремиться: тогда результаты анализа будут более значимыми и понятными при интерпретации. К сожалению, в нашем случае, когда проделана большая часть работы по анализу собранных данных, менять выборку достаточно затруднительно. Но далее, в последующих работах, стоит более серьезно подходить в выборке независимых переменных и максимально приближать закон их распределения к нормальному.

Последним этапом анализа методом главных компонент является построение уравнения регрессии на главные компоненты (в данном случае – на первую и вторую главные компоненты).

При помощи SPSS рассчитаем параметры регрессионной модели:

Таблица 22. Параметры уравнения регресии на главные компоненты

Уравнение регрессии примет вид:

y=47 414,184 + 0,916*z1+0,213*z2,

(b0) (b1) (b2)

т. о. b0=47 414,184показывает точку пересечения прямой регрессии с осью результирующего показателя;

b1= 0,916 –при увеличении значения фактора z1 на 1 ожидаемое среднее значение суммы объема инвестиций в основные средства увеличится на 0,916;

b2= 0,213 –при увеличении значения фактора z2 на 1 ожидаемое среднее значение суммы объема инвестиций в основные средства увеличится на 0,213.

В данном случае значение tкр («альфа»=0,001, «ню»=53) = 3,46 меньше tнабл для всех коэффициентов «бета». Следовательно, все коэффициенты значимы.

Далее оценим качество построенной модели:

Таблица 24. Качество регрессионной модели на главные компоненты

В Таблице 24 отражены показатели, которые характеризуют качество построенной модели, а именно: R – множественный к-т корреляции – говорит о том, какая доля дисперсии Y объясняется вариацией Z; R^2 – к-т детерминации – показывает долю объяснённой дисперсии отклонений Y от её среднего значения. Стандартная ошибка оценки характеризует ошибку построенной модели. Сравним эти показатели с аналогичными показателями степенной регрессионной модели (ее качество оказалось выше качества линейной модели, поэтому сравниваем именно со степенной):

Таблица 25. Качество степенной регрессионной модели

Так, множественный к-т корреляции R и к-т детерминации R^2 в степенной модели несколько выше, чем в модели главных компонент. Кроме того, стандартная ошибка модели главных компонент НАМНОГО выше, чем в степенной модели. Поэтому качество степенной регрессионной модели выше, чем регрессионной модели, построенной на главных компонентах.

Проведем верификацию регрессионной модели главных компонент, т. е. проанализируем ее значимость. Проверим гипотезу о незначимости модели, рассчитаем F(набл.) = 204,784 (рассчитано в SPSS), F(крит) (0,001; 2; 53)=7,76. F(набл)>F(крит), следовательно, гипотеза о незначимости модели отвергается. Модель значима.

Итак, в результате проведения компонентного анализа, было выяснено, что из отобранных независимых переменных xi можно выделить 2 главные компоненты – z1 и z2, причем на z1 в большей степени влияют переменные x1, x2, x3, а на z2 – x4, x5, x6. Уравнение регрессии, построенное на главных компонентах, оказалось значимым, хотя и уступает по качеству степенному уравнению регрессии. Согласно уравнению регрессии на главные компоненты, Y положительно зависит как от Z1, так и от Z2. Однако изначальная мультиколлинеарность переменных xi и то, что они не распределены по нормальному закону распределения, может искажать результаты построенной модели и делать ее менее значимой.

Читать еще:  Таблица анализа ошибок

Кластерный анализ

Следующим этапом данного исследования является кластерный анализ. Задачей кластерного анализа является разбиение выбранных регионов (n=56) на сравнительно небольшое число групп (кластеров) на основе их естественной близости относительно значений переменных xi. При проведении кластерного анализа мы предполагаем, что геометрическая близость двух или нескольких точек в пространстве означает физическую близость соответствующих объектов, их однородность (в нашем случае — однородность регионов по показателям, влияющим на инвестиции в основные средства).

На первой стадии кластерного анализа необходимо определиться с оптимальным числом выделяемых кластеров. Для этого необходимо провести иерархическую кластеризацию – последовательное объединение объектов в кластеры до тех пор, пока не останется два больших кластера, объединяющиеся в один на максимальном расстоянии друг от друга. Результат иерархического анализа (вывод об оптимальном количестве кластеров) зависит от способа расчета расстояния между кластерами. Таким образом, протестируем различные методы и сделаем соответствующие выводы.

Метод «ближнего соседа»

Если расстояние между отдельными объектами мы рассчитываем единым способом – как простое евклидово расстояние – расстояние между кластерами вычисляется разными методами. Согласно методу «ближайшего соседа», расстояние между кластерами соответствует минимальному расстоянию между двумя объектами разных кластеров.

Анализ в пакете SPSS проходит следующим образом. Сначала рассчитывается матрица расстояний между всеми объектами, а затем, на основе матрицы расстояний, объекты последовательно объединяются в кластеры (для каждого шага матрица составляется заново). Шаги последовательного объединения представлены в таблице:

Таблица 26. Шаги агломерации. Метод «ближайшего соседа»


ПРАКТИЧЕСКАЯ РАБОТА 11.
ФАКТОРНЫЙ АНАЛИЗ

Цель: сформировать умение обрабатывать, интерпретировать и представлять результаты факторного анализа.

1. Факторный анализ (ФА) — метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый из которых объединяет исходные переменные, имеющие сходный смысл.

Цель факторного анализа — уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации.

1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки.

2. Идентификация факторов как скрытых (латентных) переменных — причин взаимосвязей исходных переменных.

3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа переменных.

Результатом ФА является переход от множества исходных переменных к существенно меньшему числу новых переменных — факторов.

2. Фактор — в факторном анализе объединение нескольких переменных, чья взаимная корреляция исчерпывает определенную долю общей дисперсии. После процедуры вращения каждый фактор интерпретируется как некоторая общая причина взаимосвязи группы переменных.

3. Факторная структура — основной результат применения ФА. Элементы факторной структуры — факторные нагрузки переменных.

4. Метод главных компонент — метод, который лежит в основе большинства методов ФА. Он преобразует набор коррелирующих исходных переменных в другой набор — некоррелирующих переменных. Анализ главных компонент можно представить как преобразование информации, содержащейся в исходных данных. Так, определяя главную компоненту как направление, в котором наблюдается наибольший разброс объектов, представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга.

5. Вращение факторов — математическая процедура, позволяющая объяснить содержательный смысл выделенных на предыдущем этапе главных компонент, объясняющих большую часть общей дисперсии переменных.

6. Варимакс вращение — наиболее распространенный метод вращения, при котором факторы остаются независимыми или ортогональными по отношению друг к другу, так что баллы испытуемых по одному фактору не коррелируют с баллами по другим факторам.

Весь процесс ФА можно представить как выполнение нескольких :

1. Факторизация матрицы интеркорреляций.

2. Извлечение факторов, решение проблемы числа факторов.

3. Вращение факторов для создания упрощенной структуры.

4. Интерпретация факторов.

Результат выполнения заданий: умение обрабатывать, интерпретировать и представлять результаты ФА.

Задания для работы:

Задание 1. Откройте «Файл SPSS 46 ДЗ».

Для примера используются 6 переменных (вопросы, связанные с проявлением тревожности, депрессии), хотя в большинстве случаев использования ФА оперируют большим количеством переменных:

«Трев1» — я испытываю тревогу

«Трев2» — я становлюсь напряженным

«Трев3» — я спокоен

«Деп1» — я подавлен

«Деп2» — я чувствую себя бесполезным

«Деп3» — я счастлив

Проведите вычисления и интерпретацию, связанную с ФА.

Выполните следующий порядок действий:

Шаг 1. На панели инструментов выберите меню АнализОбработка данныхФактор.

Шаг 2. В открывшемся диалоговом окне из левой части окна переместите в правую все переменные, необходимые для ФА.

Шаг 3. Выберите меню Описанияв группе операций Стат установите флажок Одномерные дисперсиив группе Матрица корреляций установите флажки КоэффициентыКМО и испытание Bartlett шарообразностивыберите Продолжить.

Шаг 4. В открытом окне (Факторный анализ) выберите ИзвлечениеМетодГлавные компоненты (если он не установлен по умолчанию)отметьте Scree plotвыберите Продолжить.

Шаг 5. В открытом окне (Факторный анализ) выберите Вращение. в группе Метод установите флажок Varimaxв группе Отображение установите флажок Вращаемое решение Загрузка графика(ов)выберите Продолжить.

Шаг 6. В диалоговом окне (Факторный анализ) выберите Установки. Установите флажок Отсортированные по размерувыберите Продолжить.

Шаг 6. В открытом окне (Факторный анализ) выберите ОК, чтобы открыть окно вывода.

В результате (в окне вывода) представлены следующие параметры: одномерные описательные статистики для всех переменных, коэффициенты корреляции, критерии многомерной нормальности и адекватности выборки, матрица факторной структуры до и после вращения, график собственных значений и график факторной структуры после вращения.

Если требуется установить количество извлекаемых факторов:

Процедура обработки та же, но в диалоговом окне Факторный анализ нажимаем кнопку Извлечение. В открывшемся окне диалога убеждаемся, что по умолчанию установлено Главные компоненты. Флажком отмечаем График собственных значений, в группе Извлечение устанавливаем флажок Количество факторов и указываем предполагаемое количество. Нажимаем Продолжить.

Определение числа главных компонент (факторов):

для определения числа компонент предложено два критерия. В соответствии с первым число факторов равно числу компонент, собственные значения которых больше 1 (таблица «Полная объясненная дисперсия»). Второй критерий определяется по графику собственных значений (Scree plot) — количество факторов определяется по точке перегиба на графике до его выхода на пологую прямую после резкого спада собственных значений.

Окончательное решение о числе факторов принимается только после первичной интерпретации факторной структуры.

Критерий адекватности выборки Кайзера-Мейера-Олкина (таблица «Мера адекватности и критерий Бартлетта») — величина, характеризующая степень применимости факторного анализа к данной выборке. Правило интерпретации этого критерия следующее:

— более 0,9 — безусловная адекватность;

— более 0,8 — высокая адекватность;

— более 0,7 — приемлемая адекватность;

— более 0,6 — удовлетворительная адекватность;

— более 0,5 — низкая адекватность;

— менее 0,5 — факторный анализ неприменим к выборке.

Критерий сферичности Бартлетта (таблица «Мера адекватности и критерий Бартлетта») — критерий многомерной нормальности для распределения переменных. Помимо нормальности критерий проверяет, отличаются ли корреляции от 0. Значение , меньшее 0,05, указывает на то, что данные вполне приемлемы для проведения факторного анализа.

Описание и интерпретация результатов:

Интерпретация факторов производится по таблице факторных нагрузок после вращения (таблица «Матрица повернутых компонент») в следующем порядке:

1. По каждой переменной (строке) выделяется наибольшая по абсолютной величине нагрузка — как доминирующая. Если вторая по величине нагрузка в строке отличается от уже выделенной менее чем на 0,2, то и она выделяется, но как второстепенная.

2. После просмотра всех строк — переменных, просмотрите столбцы — факторы. По каждому фактору выписывают наименования (обозначения) переменных, имеющих наибольшие нагрузки по этому фактору. При этом обязательно учитывается знак факторной нагрузки переменной: если знак отрицательный, это отмечается как противоположный полюс фактора. 3. После такого просмотра всех факторов каждому из них присваивается наименование, обобщающее по смыслу включенные в него переменные.

Если трудно подобрать термин из соответствующей теории, допускается наименование фактора по имени переменной, имеющей по сравнению с другими наибольшую нагрузку по этому фактору.

Читать еще:  Функционально стоимостной анализ фса направлен на

Пример описания результатов ФА:

Корреляционная матрица . переменных (указать количество) была подвергнута процедуре анализа по методу главных компонент. Было извлечено . факторов (указать количество) с собственными значениями больше единицы. Эти факторы подверглись вращению по методу варимакс. Первый фактор можно интерпретировать как . (указать название), так как переменные, связанные с эти явлением, имеют по нему самые высокие нагрузки. Второй фактор можно интерпретировать как . (указать название), так как переменные, связанные с этим явлением, имеют по нему самые высокие нагрузки и т.д. Факторы, полученные в результате вращения по методу варимакс, объясняют . (указать процент) совокупной (общей) дисперсии.

Задание 2. Откройте «Файл SPSS 47 ДЗ».

1. В примере использованы данные реального тестирования интеллекта школьников (n=46). 2. Тест включал в себя 11 субтестов (переменные «и1», «и2». «и11»), наименования которых представлены в файле во вкладке «Обзор переменных».

3. Предполагалось, что эти 11 субтестов позволяют измерить обобщенные интеллектуальные характеристики: математические, вербальные, образные и т.д.

Проведите вычисления и интерпретацию, связанную с ФА.

Факторный анализ

Истинное знание есть знание причин.
Френсис Бэкон

Общие понятия

Хозяйственные процессы и конечные результаты складываются под влиянием объективных и субъективных, внешних и внутренних факторов.

Например, на величину валовой продукции непосредственное влияние оказывают такие факторы, как численность рабочих и уровень производительности труда. Субъективные или косвенные факторы — внутренние (руководство тем или иным производственным коллективом, организация производства, финансов, экономическая или организационная подготовленность исполнителей и т.д.). Следовательно, это изучение и измерение влияния факторов на величину исследуемых экономических показателей. Без всестороннего и тщательного изучения факторов невозможно сделать обоснованные выводы о результатах деятельности, выявить резервы производства, обосновать планы и управленческие решения.

Например, в модели П = ВП — С (прибыль равна выручке за минусом себестоимости) прибыль — результативный показатель, а в модели Rпр = П / РП (рентабельность продаж равна прибыли, деленной на выручку от реализации) прибыль является фактором по отношению к результативному показателю рентабельности продаж.

Различают следующие противоположные типы факторного анализа:

  • детерминированный и стохастический;
  • прямой и обратный;
  • одноступенчатый и многоступенчатый;
  • статический и динамический;
  • ретроспективный (исторический) и перспективный (прогнозный).

Факторный анализ может быть одноуровневым и многоуровневым.

Основные задачи факторного анализа:

  1. Выявление, поиск факторов.
  2. Отбор факторов для анализа исследуемых показателей.
  3. Классификация и систематизация их с целью обеспечения системного подхода.
  4. Моделирование взаимосвязей между результативными и факторными показателями.
  5. Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.
  6. Работа с факторной моделью (практическое ее использование для управления экономическими процессами).

Факторный анализ — это один из способов снижения размерности, то есть выделения во всей совокупности признаков тех, которые действительно влияют на изменение зависимой переменной. Или группировки сходно влияющих на изменение зависимой переменной признаков. Или группировки просто сходно изменяющихся признаков. Предполагается, что наблюдаемые переменные являются лишь линейной комбинацией неких ненаблюдаемых факторов. Некоторые из этих факторов являются общими для нескольких переменных, некоторые характерно проявляют себя только в одной. Те, что проявляют себя только в одной, очевидно, ортогональны друг другу и не вносят вклад к ковариацию переменных, а общие — как раз и вносят эту ковариацию. Задачей факторного анализа является как раз восстановление исходной факторной структуры исходя из наблюдаемой структуры ковариации переменных, несмотря на случайные ошибки ковариации, неизбежно возникающие в процессе снятия наблюдения.

Коэффициент взаимосвязи между некоторой переменной и общим фактором, выражающий меру влияния фактора на признак, называется факторной нагрузкой (Factor load) данной переменной по данному общему фактору. Значение (мера проявления) фактора у отдельного объекта называется факторным весом объекта по данному фактору.

Процесс стохастического факторного анализа состоит из трех больших этапов:

  1. Подготовки ковариационной матрицы (Иногда вместо нее используется корреляционная матрица);
  2. Выделения первоначальных ортогональных векторов (основной этап);
  3. Вращение с целью получения окончательного решения.

Подготовка к факторному анализу

При подготовке к факторному анализу часто (некоторые методы этого не требуют, но большая часть — требует) составляют ковариационные и корреляционные матрицы. Это матрицы, составленные из ковариации и корреляций векторов-атрибутов (строки и столбцы — атрибуты, пересечение — ковариация/корреляция).

Ковариация двух векторов:

математическое ожидание

Корреляция двух векторов:

— дисперсия.

Обратите внимание, что в этом случае корреляция и ковариация двух векторов — числа, так как считаются через матожидание вектора, а матожидание вектора — число.

Таким образом, мы переходим от матрицы, составленной из объектов (которые могут быть и не математическими), к матрице, оперирующей уже исключительно математическими понятиями, и абстрагируемся от объектов, уделяя внимания только атрибутам.

Нахождение первичной структуры факторов


Метод главных компонент

Метод главных компонент стремится выделить оси, вдоль которых количество информации максимально, и перейти к ним от исходной системы координат. При этом некоторое количество информации может теряться, но зато сокращается размерность.

Этот метод проходит практически через весь факторный анализ, и может меняться путем подачи на вход разных матриц, но суть его остается неизменной.

Основной математический метод получения главных осей — нахождение собственных чисел и собственных векторов ковариационной матрицы таких, что:

λ — собственное число R, R — матрица ковариации, V — собственный вектор R. Тогда :

и решение есть когда:

где R — матрица ковариации, λ — собственное число R, E — единичная матрица. Затем считаем этот определитель для матрицы соответствующей размерности.

V находим, подставляя собственные числа по очереди в

и решая соответствующие системы уравнений.

Сумма собственных чисел равна числу переменных, произведение — детерминанту корелляционной матрицы. Собственное число представляет собой дисперсию оси, наибольшее — первой и далее по убыванию до наименьшего — количество информации вдоль последней оси. Доля дисперсии, приходящаяся на данную компоненту, считается отсюда легко: надо разделить собственное число на число переменных m.

Коэффициенты нагрузок для главных компонент получаются делением коэффициентов собственных векторов на квадратный корень соответствующих собственных чисел.

Алгоритм NIPALS вычисления главных компонент

На практике чаще всего для определения главных компонент используют итерационные методы, к примеру, NIPALS:

0. Задается 0 T размера 2*2 для двух столбцов(факторов) bi и bj матрицы B такую, что критерий для матрицы [bibj]R максимален.

2. Заменяем столбцы bi и bj на столбцы .

3. Проверяем, все ли столбцы перебрали. Если нет, то 1.

4. Проверяем, что критерий для всей матрицы вырос. Если да, то 1. Если нет, то конец.

Критерий квартимакс

Формализуем понятие факторной сложности q i-ой переменной через дисперсию квадратов факторных нагрузок факторов:

,

где r — число столбцов факторной матрицы, bij — факторная нагрузка j-го фактора на i-ю переменную, — среднее значение. Критерий квартимакс старается максимизировать сложность всей совокупности переменных, чтобы достичь легкости интерпретации факторов (стремится облегчить описание столбцов):

Учитывая, что — константа (сумма собственных чисел матрицы ковариации) и раскрыв среднее значение (а также учтя, что степенная функция растет пропорционально аргументу), мы получим:

Этот критерий и предполагается итеративно максимизировать. Этот критерий стремится к одному генеральному фактору.

Критерий варимакс

Этот критерий использует формализацию сложности фактора через дисперсию квадратов нагрузок переменной:

И тогда критерий в общем

При этом, как легко заметить, максимизируется сложность описания Факторные нагрузки могут нормироваться для избавления от влияния отдельных переменных. Дает лучшее разделение факторов, чем квартимакс.

Другие критерии

Можно обобщить два вышеприведенных критерия и получить новый:

Запишем его в следующем виде: Тогда при γ = 0 это квартимакс, при γ = 1 — варимакс, а при — эвримакс, а при γ = 0,5 биквартимакс.

Косоугольное вращение

Косоугольное вращение не требует ортогональности между факторами. В остальном его алгоритм похож на ортогональное вращение. За счет этого можно получать больше нулей в факторных нагрузках и получать более характерные факторы. Правда, при этом возникает корреляция между факторами, что вообще не очень хорошо и приходится объяснять факторами 2го порядка. Их, кстати, тоже можно вычислить, причем используя ортогональное вращение и косоугольные факторы как исходные данные.

Методы введения вторичных осей

На основе квартимакса создается критерий квартимин:

где aij и aij — проекции на j-ю и k-ю оси. При применении ортогонального вращения этот критерий сводится к квартимаксу. При наипростейшей структуре N=0, а реально должно к нему стремится.

На основе варимакса создается критерий коваримин:

Минимизируется ковариация квадратов проекции на различные оси.

Объединение их, как и в ортогональном вращении, приводит к критерию облимин:

Прямой метод облимин

Используется критерий облимин, только при этом в качестве аргументов выступают нагрузки факторов первичной структуры:

d регулирует косоугольность решения, меньшие отрицательные d — больше ортогональность

Вещество и поле не есть что-то отдельное от эфира, также как и человеческое тело не есть что-то отдельное от атомов и молекул его составляющих. Оно и есть эти атомы и молекулы, собранные в определенном порядке. Также и вещество не есть что-то отдельное от элементарных частиц, а оно состоит из них как базовой материи. Также и элементарные частицы состоят из частиц эфира как базовой материи нижнего уровня. Таким образом, всё, что есть во вселенной — это есть эфир. Эфира 100%. Из него состоят элементарные частицы, а из них всё остальное. Подробнее читайте в FAQ по эфирной физике.

интервью Раввина Борода https://cursorinfo.co.il/all-news/rav.
мой телеграмм https://t.me/peshekhonovandrei
мой твиттер https://twitter.com/Andrey54708595
мой инстаграм https://www.instagram.com/andreipeshekhonow/

[b]Мой комментарий:
Андрей спрашивает: Краснодарская синагога — это что, военный объект?
— Да, военный, потому что имеет разрешение от Росатома на манипуляции с радиоактивными веществами, а также иными веществами, опасными в отношении массового поражения. Именно это было выявлено группой краснодарцев во главе с Мариной Мелиховой.

[center][Youtube]CLegyQkMkyw[/Youtube][/center]
[center]10:22 [/center]

Доминико Риккарди: Россию ждёт страшное будущее (хотелки ЦРУ):
https://tainy.net/22686-predskazaniya-dominika-rikardi-o-budushhem-rossii-sdelannye-v-2000-godu.html

Завещание Алена Даллеса / Разработка ЦРУ (запрещено к ознакомлению Роскомнадзором = Жид-над-рус-надзором)
http://av-inf.blogspot.com/2013/12/dalles.html

[center][b]Сон разума народа России [/center]

[center][Youtube]CLegyQkMkyw[/Youtube][/center]
[center]10:22 [/center]

Доминико Риккарди: Россию ждёт страшное будущее (хотелки ЦРУ):
https://tainy.net/22686-predskazaniya-dominika-rikardi-o-budushhem-rossii-sdelannye-v-2000-godu.html

Завещание Алена Даллеса / Разработка ЦРУ (запрещено к ознакомлению Роскомнадзором = Жид-над-рус-надзором)
http://av-inf.blogspot.com/2013/12/dalles.html

[center][b]Сон разума народа России [/center]

Факторный анализ, его виды и методы

Все явления и процессы хозяйственной деятельности предприятий находятся во взаимосвязи и взаимообусловленности. Одни из них непосредственно связаны между собой, другие косвенно. Отсюда важным методологическим вопросом в экономическом анализе является изучение и измерение влияния факторов на величину исследуемых экономических показателей.

Факторный анализ в учебной литературе трактуется как раздел многомерного статистического анализа, объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц.

Свою историю факторный анализ начинает в психометрике и в настоящее время широко используется не только в психологии, но и в нейрофизиологии, социологии, политологии, в экономике, статистике и других науках. Основные идеи факторного анализа были заложены английским психологом и антропологом Ф. Гальтоном. Разработкой и внедрением факторного анализа в психологии занимались такие ученые как: Ч.Спирмен, Л.Терстоун и Р.Кеттел. Математический факторный анализ разрабатывался Хотеллингом, Харманом, Кайзером, Терстоуном, Такером и другими учеными.

Данный вид анализа позволяет исследователю решить две основные задачи: описать предмет измерения компактно и в то же время всесторонне. С помощью факторного анализа возможно выявление факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

Цели факторного анализа

К примеру, анализируя оценки, полученные по нескольким шкалам, исследователь отмечает, что они сходны между собой и имеют высокий коэффициент корреляции, в этом случае он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором, который влияет на многочисленные показатели других переменных, что приводит к возможности и необходимости отметить его как наиболее общий, более высокого порядка.

Таким образом, можно выделить две цели факторного анализа:

  • определение взаимосвязей между переменными, их классификация, т. е. «объективная R-классификация»;
  • сокращение числа переменных.

Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов. Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство данного метода также в том, что он – единственный математически обоснованный метод факторного анализа.

Факторный анализ – методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя.

Типы факторного анализа

Существуют следующие типы факторного анализа:

1) Детерминированный (функциональный) – результативный показатель представлен в виде произведения, частного или алгебраической суммы факторов.

2) Стохастический (корреляционный) – связь между результативным и факторными показателями является неполной или вероятностной.

3) Прямой (дедуктивный) – от общего к частному.

4) Обратный (индуктивный) – от частного к общему.

5) Одноступенчатый и многоступенчатый.

6) Статический и динамический.

7) Ретроспективный и перспективный.

Также факторный анализ может быть разведочным – он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках и конфирматорным, предназначенным для проверки гипотез о числе факторов и их нагрузках. Практическое выполнение факторного анализа начинается с проверки его условий.

Обязательные условия факторного анализа:

  • Все признаки должны быть количественными;
  • Число признаков должно быть в два раза больше числа переменных;
  • Выборка должна быть однородна;
  • Исходные переменные должны быть распределены симметрично;
  • Факторный анализ осуществляется по коррелирующим переменным.

При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.

Этапы факторного анализа

Как правило, факторный анализ проводится в несколько этапов.

Этапы факторного анализа:

1 этап. Отбор факторов.

2 этап. Классификация и систематизация факторов.

3 этап. Моделирование взаимосвязей между результативным и факторными показателями.

4 этап. Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.

5 этап. Практическое использование факторной модели (подсчет резервов прироста результативного показателя).

Детерминированный факторный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит функциональный характер, т. е. когда результативный показатель факторной модели представлен в виде произведения, частного или алгебраической суммы факторов.

Методы детерминированного факторного анализа: Метод цепных подстановок; Метод абсолютных разниц; Метод относительных разниц; Интегральный метод; Метод логарифмирования.

Данный вид факторного анализа наиболее распространен, поскольку, будучи достаточно простым в применении (по сравнению со стохастическим анализом), позволяет осознать логику действия основных факторов развития предприятия, количественно оценить их влияние, понять, какие факторы, и в какой пропорции возможно и целесообразно изменить для повышения эффективности производства.

Стохастический анализ представляет собой методику исследования факторов, связь которых с результативным показателем в отличие от функциональной является неполной, вероятностной (корреляционной). Если при функциональной (полной) зависимости с изменением аргумента всегда происходит соответствующее изменение функции, то при корреляционной связи изменение аргумента может дать несколько значений прироста функции в зависимости от сочетания других факторов, определяющих данный показатель.

Методы стохастического факторного анализа: Способ парной корреляции; Множественный корреляционный анализ; Матричные модели; Математическое программирование; Метод исследования операций; Теория игр.

Необходимо также различать статический и динамический факторный анализ. Первый вид применяется при изучении влияния факторов на результативные показатели на соответствующую дату. Другой вид представляет собой методику исследования причинно-следственных связей в динамике.

И, наконец, факторный анализ может быть ретроспективным, который изучает причины прироста результативных показателей за прошлые периоды, и перспективным, который исследует поведение факторов и результативных показателей в перспективе.

Источник: Анализ и диагностика финансово хозяйственной деятельности предприятия. Учебное пособие. Бальжинов А.В., Михеева Е.В. (скачать)

Ссылка на основную публикацию
Adblock
detector