Robo6log.ru

Финансовый обозреватель
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Компонентный анализ объяснение проекциями

Метод компонентного анализа;

Изначально структурные методы служили изучению формальных свойств языка, но со временем их стали использовать и для исследования языковой семантики. В результате этого возникла структурная семасиология. Ее основным методом является компонентный анализ– специализированный вариант дифференциального анализа. Компонентный анализ основан на представлении о том, что все лексические единицы языка образуют в системе языка упорядоченные ряды, лексико-семантические группы (ЛСГ).

В пределах ЛСГ слова? ориентируют своё значение друг на друга: имеют нечто общее – общий семантический признак и нечто отличное – дифферен­циальный семантический признак. Основная цель компонентного анализа – выявить дифференциальные семантические признаки значения слова посредством последовательно проводимых противопоставлений (И.П. Распо­пов, 1976, с. 82).

Например, лексико-семантическая группа родственных отношений отец, мать, сын, дочь, брат, сестра, дядя, тётя объединяется общим семантическим признаком «родственники» (Р). Эти слова сопоставляются друг с другом по линиям:

а) пол: мужской (1) – женский (2);

б) поколение: одно поколение (3) – разные поколения (4): предшест­вующее – последующее (5);

в) степень родства: прямое родство (6) – непрямое родство (7).

На основе подобных сопоставлений выделяются дифференциальные семантические признаки: 1–2, 3–(4–5), 6–7. Значения каждого слова описывается в виде комбинаций общего семантического признака и дифференциальных семантических признаков. Мать:Р 2 4 6 (родственник женского пола предшествующего поколения прямой); сын: Р 1 3 6 (родственник мужского пола последующего поколения прямой и т.п.). При компонентном анализе каждое слово рассматривается как член ЛСГ, т.е. этот метод имеет дело не с отдельным словом, а с ЛСГ в целом, хотя его задача – описать значение отдельных слов.

При компонентном анализе осуществляется многократная перегруппировка слов ЛСГ. Отдельные слова могут «сходиться» и «расходиться» друг с другом по одной или нескольким линиям сопоставления. Не все ЛСГ поддаются компонентному анализу, например ЛСГ цветообозначений. Этот метод не исчерпывает реальной семантики слов, однако выявляет семантическую структуру слова. Определить семантическую структуру языковой единицы – зна­чит:

а) выделить мельчайшие единицы ее содержания;

б) уста­новить между ними закономерные связи и отношения.

Мельчайшая единица плана содержания языкового знака – это сема (от греч. sema – знак), это компонент элементарного значения. Автор термина – В. Скаличка. Наряду с термином сема употребляются термины:

Oдифференциальный элемент (Ф. де Соссюр);

Oфигура со­держания (Л. Ельмслев);

Oсемантический множитель (Ю.Д. Ап­ресян);

Oдифференциальный признак (И.В. Арнольд);

Oноэма (Э, Кошмидер, Г. Мейер);

Oсемантический маркёр(Д. Болинджер, Дж. Кац и Дж. Фодор).

Семы – это элементарные отражения в языке различных сторон и свойств предметов и явлений действительности. Сема – операциональная единица компонентного анализа. С. реализуется как компонент семемы.

Семема – элементарное значение слова, лексико-семантический вариант слова (Л.А. Новиков). Это содержание слова в противоположность лексеме – внешней оболочке слова (звуковому комплексу). Семема состоит из сем. Центральной и главной в структуре семемы является архисема (автор термина – Б. Потье) – общая сема, свойственная всем единицам класса. Напр., архисема ‘животное’ объединяет слова лев, собака, обезьяна и др. Это сема, интегрирующая родовое значение. Ей противостоят семы, дифференцирующие видовое значение – дифференциальные семы.

Семема ЛСВ отец (как термин родства) содержит в своём составе взаимосвязанные семы ’мужской пол’, ’родитель’, ’родитель прямого родства’, ’кровный родитель’, ’родитель в первом поколении’. Эти семы образуют в совокупности значение данного ЛСВ, противопоставленного другим словам (лексико-семантическим вариантам, обозначающим родство: мать, дед, сын, брат, сестра). Архисема и дифференциальные семы находятся в гиперо-гипономических отношениях.

Кроме указанных сем в структуре семемы выделяются контекстуальные семы, возникающие в определённых ситуациях употребления лексической единицы. За счёт таких сем создаются оттенки значения, на основе которых развиваются новые производные значения.

Потенциальные семы отражают побочные свойства предмета, реально существующие или приписываемые ему коллективом важны при переносном употреблении. Напр., у слов ползти, лететь имеет место архисема ’движение’, дифференциальные семы – ’способ передвижения’, потенциальные – ’темп движения’. При переносном употреблении сло?ва архисема и дифференциальная сема отходят на задний план, потенциальные – актуализируются, получая статус дифференциальных (время ползёт, летит).

Семема реализуется на коммуникативном уровне (в тексте, речи) как элементарное значение слова. Сема – единица более низкого уровня, выделяется на уровне лингвистического анализа (Л.А. Новиков, 1982).

Существует два подхода к анализу семантической структуры – макролингвистический и микролингвистический. При первом подходе делается акцент на связь между семами и признаками денотата. Эту точку зрения разделяют В.Г. Гак, Ю. Найда, Дж. Кац и Дж. Фодор, Г. Вотяк, А. Греймас и другие сторонники макролингвистического подхода к анализу семантической структуры. При­верженцы микролингвистического подхода сущность сем рас­крывают через их соотношение в рамках взаимодействующих язы­ковых единиц на синтагматической и парадигматической оси (Н.Ф. Алефиренко, 2005, с. 376).

В лингвистике существуют следующиеспособы выявления сем в структуре того или иного значения:

а) логический; основанный на установлении гносеологичес­ких связей между семами и признаками денотата;

б) лингвистический, использующий совместную встречаемость (сочетаемость, синтагматику) семантически близких слов в речи;

в) логико-лингвистический, сочетающий в себе логические и лингвистические приемы выделения сем.

Метод компонентного анализа применяют в лексической семантике, начиная с 60-х гг. ХХ в., с различными целями, основной из которой является описание лексических значений. Этот метод хорошо зарекомендовал себя и при решении прикладных задач, таких как информационный поиск, автоматическое понимание текста. Метод компонентного анализа решает важные проблемы семасиологии, в частности разграничение полисемии и омонимииподробнее

Компонентного анализа метод

метод исследования содержательной стороны значимых единиц языка, имеющий целью разложение значения на минимальные семантические составляющие. К. а. м. впервые был использован при исследовании лексического материала как техника описания узкого круга лексических единиц (терминов родства) в разных языках (50‑е гг. 20 в.). Он основан на гипотезе о том, что значение каждой единицы языка состоит из семантических компонентов (сем) и что словарный состав языка может быть описан с помощью ограниченного и сравнительно небольшого числа семантических признаков. К. а. м. тесно связан с системно-парадигматическими представлениями о языке (см. Парадигматика), в частности с теорией поля, и может рассматриваться как расширение и углубление её теоретической и инструментально-методической базы. Этот метод обнаруживает связь с идеями Р. О. Якобсона, Л. Ельмслева и других, считавших возможным перенесение принципов фонологии Н. С. Трубецкого в грамматику и семантику. На основе К. а. м. семантическое поле определяется как ряд парадигматически связанных слов или их отдельных значений, имеющих в своём составе общий (интегральный) семантический признак и различающихся по крайней мере по одному дифференциальному признаку. Общие и дифференциальные признаки, так же как и содержащие их слова, образуют определённые иерархии, структуры (ср. интегральный признак «родство» и дифференциальные признаки «пол», «поколение», «степень родства» в семантическом поле родства). Один и тот же семантический признак в разных семантических полях может иметь разный иерархический статус (от компонента дифференциального признака до категориального, существенного для всей системы языка в целом), как, например, сема «пол», входящая в значения слов с признаком одушевлённости. Предполагается, что наиболее общие категориальные семантические признаки имеют универсальную значимость и могут быть представлены (по-разному) во многих или во всех языках.

Читать еще:  План факторный анализ

Характер компонентного состава лексического значения зависит от степени конкретности (абстрактности) выражаемого данным словом понятия. При компонентном описании предметно ориентированных слов (так называемых денотативов типа «слон», «грач», «сосна») значительно повышается роль индивидуальных (уникальных) признаков, характеризующих только данное слово (ср. сему «наличие хобота» у слова «слон»), а также возрастает вероятность совпадения содержания семантического признака слова и признака предмета, обозначенного данным словом. На этом основании некоторые учёные относят компонентный анализ денотативов к области внеязыковой семантики (Ж. Мунен и другие).

Применение К. а. м. в синтагматике обнаруживает ряд закономерностей функционирования слов в речи: правила селекционных ограничений (Дж. Кац, Дж. Фодор), правила сложения лексических значений (Ю. Д. Апресян), правила семантического согласования (В. Г. Гак). На их основе устанавливаются, в частности, условия правильного выбора слов в словосочетании, зависящие от наличия общей семы в обеих частях словосочетания, отсутствия (погашения) противоречивых сем в одной из частей словосочетания. При этом повтор сем выступает как важное конструктивное средство построения речи, подобное по функции другим синтагматическим средствам языка.

В 70—80‑х гг. 20 в. К. а. м. стал применяться также в грамматике, особенно в морфологии (Е. В. Гулыга, Е. И. Шендельс). В советском языкознании делаются попытки компонентного анализа простых и сложных предложений (работы О. И. Москальской, В. А. Белошапковой, Гака, Е. М. Вольф). Совершенствуются существующие и разрабатываются новые приёмы и методы выявления семантических признаков, устанавливаются типы их взаимосвязи. Эти приёмы и методы дополняют в расширяют К. а. м.: методы лингвистического эксперимента, ведущие начало от идей Л. В. Щербы и А. М. Пешковского, методы оппозиции и комбинаторики (Т. П. Ломтев), различные процедуры анкетирования и опроса информантов (О. Н. Селиверстова и другие), компонентного синтеза (А. М. Кузнецов), варьирования синтагматической сочетаемости слов (Апресян и другие), метод словарных дефиниций (Ю. Н. Караулов и другие), а также психолингвистические экспериментальные приёмы исследования.

  • Кузнецов А. М., О применении метода компонентного анализа в лексике, в кн.: Синхронно-сопоставительный анализ языков разных систем, М., 1971;
  • его же, От компонентного анализа к компонентному синтезу, М., 1986;
  • Гак В. Г., К проблеме семантической синтагматики, в кн.: Проблемы структурной лингвистики, 1971, М., 1972;
  • Селиверстова О. Н,, Компонентный анализ многозначных слов, М., 1975;
  • Гулыга Е. В., Шендельс Е. И., О компонентном анализе значимых единиц языка, в кн.: Принципы и методы семантических исследований, М., 1976;
  • Nida E. A., Componential analysis of meaning: an introduction to semantic structures, The Hague — P., 1975.

Лингвистический энциклопедический словарь. — М.: Советская энциклопедия . Гл. ред. В. Н. Ярцева . 1990 .

Смотреть что такое «Компонентного анализа метод» в других словарях:

МЕТОД — (от греч. methodos – путь). Базисная категория методики, в самом общем значении – способ достижения цели, определенным образом упорядоченная деятельность. Это понятие употребляется в современной науке в трех значениях: общеметодологическом (М.… … Новый словарь методических терминов и понятий (теория и практика обучения языкам)

Метод — (от греч. μέθοδος путь исследования) в языкознании 1) обобщённые совокупности теоретических установок, приёмов, методик исследования языка, связанные с определённой лингвистической теорией и с общей методологией, так называемые общие методы.… … Лингвистический энциклопедический словарь

Компонентный анализ — Компонентный анализ в языкознании: метод исследования плана содержания значимых единиц языка, целью которого является разложение значения на минимальные семантические составляющие. Основан на гипотезе о том, что значение всякой языковой… … Википедия

Сема — (от греч. σῆμα знак) минимальная, предельная единица плана содержания. Семы представляют собой элементарные отражения в языке различных сторон и свойств обозначаемых предметов и явлений действительности. Сема является операциональной единицей… … Лингвистический энциклопедический словарь

Структурная лингвистика — Структурная лингвистика совокупность воззрений на язык и методов его исследования, в основе которых лежит понимание языка как знаковой системы (см. Знак языковой) с чётко выделимыми структурными элементами (единицами языка, их классами и пр.) и… … Лингвистический энциклопедический словарь

Семантика — (от греч. σημαντικός обозначающий) 1) всё содержание, информация, передаваемые языком или какой либо его единицей (словом, грамматической формой слова, словосочетанием, предложением); 2) раздел языкознания, изучающий это содержание, информацию; … Лингвистический энциклопедический словарь

Морфология — (от греч. μορφή форма и λόγος слово, учение) 1) система механизмов языка, обеспечивающая построение и понимание его словоформ; 2) раздел грамматики, изучающий закономерности функционирования и развития этой системы. Объём понятия «морфология»… … Лингвистический энциклопедический словарь

Оппозиции — (от лат. oppositio противопоставление) языковые лингвистически существенное (выполняющее семиологическую функцию) различие между единицами плана выражения, которому соответствует различие между единицами плана содержания (см. Знак языковой), и… … Лингвистический энциклопедический словарь

ЛЭС : Рецензия — Рецензия ¤ Герд А. С. [Рецензия] // Известия Академии наук СССР. Серия литературы и языка. М.: Наука, 1991. Т. 50. № 4. С. 373 375. Рец. на кн.: Лингвистический энциклопедический словарь / Гл. ред. В. Н. Ярцева. М.: Сов. энциклопедия, 1990. … Лингвистический энциклопедический словарь

Единицы языка — Единицы языка элементы системы языка, имеющие разные функции и значения. Совокупности основных Е. я. в узком смысле этого термина образуют определённые «уровни» языковой системы, например фонемы фонемный уровень, морфемы морфемный уровень и др … Лингвистический энциклопедический словарь

Компонентный анализ

КА обнаруживает несомненную связь с классическими методиками изучения лексики, в особенности с её лексикографическим представлением значений слов и теорией поля в лингвистике [Щур 2007][367].
Но концептуальное становление КА пришлось на период лингвистического структурализма, поэтому многие лингвисты рассматривают КА как вари
ант оппозиционной методики, перенесенной на лексический уровень и на семантику двусторонних единиц языка, что в общем-то вполне правомерно.
Однако расширение теоретической базы КА связано с работами Э. Кош- мидера и Г.Ф. Мейера (Германия), с успехами американской этнолингвистики, с трудами представителей генеративной семантики (Э.Х. Бендикс, Дж. Катц и др.) и идеями отечественных учёных в области структурной семантики.
За 60 лет своей эволюции КА превратился из методики, «дававшей представление значения отдельно взятого слова в виде неупорядоченного набора однотипных минимальных компонентов, в метод анализа слова в типовом сен- тенциональном контексте, результаты которого представляются в виде разнообразных семантических метаязыков» [Кобозева 2000 : 120-122], а сам КА сегодня имеет множество вариантов, которые могут существенно различаться в процедуре анализа[368].
Компонетный анализ (в своём классическом варианте) — это методика исследования содержательной стороны значимых единиц языка, состоящая в разложении значения на минимальные семантические составляющие с целью выявления и представления семантической структуры этих единиц.
Сущность КА определяется рядом исходных постулатов: в соответствии с достижениями лингвистики постулируется, что значение двусторонних единиц языка (в том числе — и слова) — это сложные феномены; эти сложные феномены можно разложить на составляющие компоненты[369]; языковые подсистемы (в том числе и словарный состав языка) может быть описан с помощью ограниченного и сравнительно небольшого числа семантических признаков [Кузнецов (ЛЭС) 2002 : 233-234].
Базовые концепты КА: Сема (lt;греч. sema — «знак») — минимальный смысловой элемент значения; конструктивный компонент семемы. Семема — пучок сем [Тарланов 1995 : 79]. Структура семемы — пучок структурно упорядоченных сем; иерархическая взаимосвязь и взаимозависимость сем одной семемы.
У многозначных слов семема синонимична термину лексико-семантический вариант (А.И. Смирницкий). Семантический признак — это определенный параметр или аспект значения слова или какой-либо другой двусторонней единицы языка [Алефи- ренко 2009-б : 377].

Читать еще:  Анализ реализации бизнес плана

В КА существует три основных подхода к способам выявления сем в структуре значения: логический, основанный на установлении гносеологических связей между семами и признаками денотата; лингвистический, использующий совместную встречаемость (сочетаемость, синтагматику) семантически близких слов в речи; логико-лингвистический, сочетающий в себе логические и лингвистические приёмы [Алефиренко 2009-б : 377].

Покажем действие логического способа на примере слова птица с использованием логических приёмов и упрощенной символики[370]: включение в класс ‘птица (х)’ з ‘животное’; включение в подкласс: ‘птица (х)’ з ‘позвоночное животное’; серия предикаций, т. е. приписывание признаков х-у (V х для всякого х верно, что. ‘): х ‘иметь’ (х, ‘крылья’); х ‘иметь’ (х, ‘две конечности’); х ‘иметь’ (х, ‘клюв’); х ‘быть покрытым’ (х, ‘перья’);
Vх ‘быть покрытым’ (х, ‘пух’) [Сусов 2007 : 95].
Дж. Лайонз в своём учебнике «Введение в теоретическую лингвистику» для выявления семного состава значения использует приём семантических пропорций типа: a : b = c : d (кислород : газ = клубника : ягода) [Лайонз 1978 : 496-497]. Интересный вариант предложен А.Я. Шайкевичем, представляющий собой дистрибутивно-статистический анализ [Шайкевич 1976 : 353-377].
Начинающие лингвисты чаще других применяют логический способ выделения сем, но при этом иногда допускают ошибки, обусловленные тем, что подменяют анализ языковых значений анализом всех существенных реальных и возможных признаков, характерных денотату.
Критический анализ такого подхода в работах Г. Мейера дают Е. В. Гу- лыга и Е. И. Шендельс [Гулыга, Шендельс 1976 : 291-314]. Стремясь избежать подобных недостатков, часто языковые значения отграничивают от логических при помощи словарных дефиниций. Такой подход обычно называют де ф ин и ци о н ны м вар иан то м К А .
Этот логико-лингвистический подход в наши дни является господствующим, что предполагает наличие ряда вариантов КА.
Один из ранних вариантов описывает Юджин Найда в учебном пособии «Компонентный анализ значений», процедура которого дана в русском переводе [Найда 1983 : 61-74].
Предлагаемую процедуру КА Ю. Найда называет процедурой вертикально-горизонтального анализа значений; поскольку она предусматривает анализ значений слов в двух измерениях: 1) в вертикальном, когда сравниваются значения, стоящие на разных уровнях иерархии родо-видовых отноше

ний и 2) в горизонтальном, когда сравниваются значения одного и того же уровня иерархии.
Процедура такого анализа состоит из пяти этапов.
Первый этап состоит в нахождении гиперонима слова, например, для слова «журнал» (англ. magazine), это будет «периодическое издание».
Второй этап состоит в подборе гипонимов данного слова, т. е. названия конкретных журналов.
Третий этап заключается в анализе единиц того же самого иерархического уровня, к которому принадлежит данное слово, т. е. в анализе синонимов и антонимов.
Четвертый этап — основной, т.к. на этом этапе составляется список минимальных диагностических компонентов (сем), которые группируются в определённые блоки. Так, для слова «журнал» выделяется три крупных блока: периодическое издание’; 2) ’переплетенное или сброшюрованное’ и 3) ’по содержанию и оформлению носящее довольно популярный характер’.
Пятый этап — заключительный и, по мнению Ю. Найды, факультативный, состоит в формулировании дефиниции слова на основе его диагностических признаков.
Как видим, предложенный вариант КА является типичным для начального периода КА, когда анализируются отдельные, изолированные слова с учётом парадигматических отношений (корреляций)[371].
Но в зависимости от цели и задач исследования вариант КА, предложенный Ю. Найдой, является вполне эффективным. Приведём, к примеру, схему семной структуры глагола резать, выявленную В.Г. Гаком (1976 : 90)[372].
Схема 24

Приведённые варианты КА для конкретной лексики на парадигматическом уровне, представленные в виде схем (см. схему 24) или в виде таблиц[373], нашли широкое использование в работах И.В. Арнольд, Э.В. Кузнецовой,

А.А. Уфимцевой, И.А. Стернина, Ю.Д. Апресяна, Ю.Н. Караулова, О.Н. Селиверстовой, Э. М. Медниковой и многих других.
Из многих направлений КА особенно перспективными в силу его объективности [Болотнова 2009 : 453] представляется методика ступенчатой идентификации на основе словарных дефиниций, разработанная Эрой Васильевной Кузнецовой. Она заключается в последовательном сведении слов-идентифи-ка- торов к словам с предельным значением на базе словарных дефиниций.
Рассмотрим пример из учебного пособия Э.В. Кузнецовой.
Выловить — извлечь из жидкой среды; извлечь — достать изнутри; достать — взять откуда-либо; взять — получить; получить — взять.
Процедура многоступенчатой идентификации продолжается до тех пор, пока в сопоставляемых толкованиях не возникнет ситуация «взаимной идентификации». В нашем примере это взаимная идентификация глаголов взять и получать. Такая ситуация сигнализирует, что дальнейшее разложение значений с помощью слов того же языка невозможно.
Конечные идентификаторы можно принять за лексико-семантические единицы, которые как бы олицетворяют семантические компоненты, представленные в значениях всех глаголов и объединяющие их. Так, в приведённом примере идентификатор взять является манифестатором категориально-лексической семы «приобщение объекта», на основе которой они включается в соответствующую лексико-семантическую группу глаголов [Кузнецова 1989 : 37].
Для анализа абстрактной и служебной лексики эффективен вариант АК, разработанный представителями Московской семантической школы [Мельчук 1974 : 62-67; Кобозева 2000 : 115-120].
КА активно используется на разных языковых уровнях различных языков для выявления иерархии сем в качестве самостоятельной задачи.
Так, вслед за Б. Потье, Владимир Григорьевич Гак даёт следующую иерархию сем: архисема (категориальная сема) — общая сема родового характера, например, у слова лошадь — ’одушевлённое существо’; дифференциальные семы видового характера: 1) описательные, отражающие индивидуальные свойства и признаки предмета и 2) о тноси- тельные, отражающие связи и отношения данного предмета с другими; потенциальные семы — скрытые элементарные смыслы, возможность выявления которых обеспечивается актуализацией слова в речи, например, у слова лошадь ’тяжесть’ или у слова автомобиль — ’состоятельность’ и т. п. [Гак 1988; Алефиренко 2009-б]. Наконец, третий подход к выделению сем — чисто лингвистиче- с к и й , который базируется на уровне синтагматики и заключается в анализе семантики слов (или других единиц языка), исходя из совместной встречаемости слов (единиц) в текстах.
В этом случае методика извлечения сем сводится к следующим шагам: фиксируются все случаи совместного появления в тексте двух слов, одно из которых является анализируемым; составляется список слов-синонимов; аллонимы группируются в семантически близкие классы; каждому классу присваивается обобщенное значение. Эти обобщенные значения и являются семемами (семантическими, структурными) исследуемых слов.
Такой вариант выделения сем позволяет избежать субъективности в анализе языковых значений, поскольку семы извлекаются из текста при помощи формализованных процедур [Алефиренко 2009-б : 381].
Зародившись как основная методика структурной семасиологии, КА был перенесен на морфемный уровень, а затем на морфологический (И. Вахек, Е. В. Гулыга и Е. И. Шендельс) и синтаксический (О. И. Мос- кальская, В. А. Белошапкова, В. Г. Гак, Е. М. Вольф).
На уровне грамматики КА направлен, прежде всего, на анализ грамматических категорий и грамматической семантики, где он используется, по мнению Замира Курбановича Тарланова, «особенно результативно», что обеспечивает КА «важную роль в современных грамматических исследованиях» [Тарла- нов 1995 : 81].
КА продолжает своё совершенствование и сегодня, избавляясь от ограничений структурализма через синтез[374] с другими методиками и методами. Совершенствуясь в процедурном аспекте, КА «обрастает теорией, тем самым трансформируясь в автономную лингвистическую концепцию» [Тарланов 1995 : 67]. Иначе говоря, компонентный анализ из методики трансформируется в метод, что отмечают многие лингвистические источники.

Читать еще:  К ситуационному анализу относится

Компонентный анализ

Компонентный анализ (components analysis) – многомерный статистический метод снижения размерности, применяемый для изучения взаимосвязей между значениями количественных переменных. Задача компонентного анализа состоит в преобразовании исходной системы взаимосвязанных переменных в новую систему некоррелированных обобщенных показателей или ортогональных показателей. Новые некоррелированные показатели называются компонентами.

Алгоритм компонентного анализа состоит в последовательном извлечении компонент. Для единственности решения в методе главных компонент компоненты должны быть упорядочены по убыванию доли объясняемой суммарной дисперсии исходных переменных. Первая компонента характеризует наибольшую долю вариации исходных переменных, вторая компонента объясняет наибольшую долю дисперсии, не объясняемой первой компонентой и т.д. В результате компонентного анализа число полученных некоррелированных компонент совпадает с числом исходных переменных. Т.е. классический компонентный анализ сохраняет размерность пространства переменных.

Каждой извлеченной компоненте соответствует характеристика, называемая собственным значением. Собственное значение показывает часть вариации исходных переменных, объясняемую компонентой. В компонентном анализе, если используется корреляционная матрица, каждая переменная стандартизирована и ее дисперсия равна 1. Следовательно, если число исходных переменных k, то суммарная дисперсия равна k. Компонентный анализ сохраняет всю суммарную дисперсию, поэтому сумма всех собственных значений равна числу исходных переменных.

На основе полученных собственных значений рассчитывается матрица нагрузок и дается интерпретация компонент. На основе полученной матрицы нагрузок в компонентном анализе может быть произведено вращение факторов для получения простой структуры матрицы нагрузок. Классический компонентный анализ, в отличие от факторного анализа, не предполагает вращение матрицы нагрузок. Но вращение настолько полезная возможность методов снижения размерности, что алгоритмы вращения были разработаны для компонентного анализа.

На основе окончательной матрицы нагрузок рассчитывают индивидуальные значения главных компонент для каждого объекта наблюдения. Индивидуальные значения главных компонент на объектах представляют собой линейную комбинацию исходных переменных для каждого фактора. На практике для интерпретации и дальнейшего анализа используют компоненты, удовлетворяющие следующим условиям:

  • их собственные значения должны быть больше 1 – это означает, что компонента более информативна, чем стандартизированная переменная;
  • компонента должна иметь хотя бы одну нагрузку больше критического значения – это означает, что компонента тесно связана, по крайней мере, с одной исходной переменной.

Отобранные для дальнейшего анализа компоненты называют главными компонентами. Отсюда название метода – метод главных компонент. Индивидуальные значения главных компонент могут быть использованы для дальнейшего статистического анализа, например:

  • построения уравнения регрессия на главные компоненты;
  • кластеризации наблюдений по главным компонентам.

Очень часто под термином «факторный анализ» понимают методы факторного и компонентного анализов. На самом деле, компонентный анализ представляет собой самостоятельный метод снижения размерности.

Факторный и компонентный анализы – оба метода снижения размерности. Оба метода решают в принципе одну и ту же задачу и поэтому результаты похожи. В матрицах нагрузок первый общий фактор и первая главная компонента, как правило, совпадают. Второй фактор может уже существенно отличаться от второй главной компоненты и т.д. Иногда даже число общих факторов может существенно отличаться от числа весомых главных компонент.

Предпосылки методов факторного и компонентного анализа различаются. Цель компонентного анализа – объяснить всю корреляцию между переменными и всю суммарную дисперсию исходных переменных. Число первоначально извлеченных компонент совпадает с числом исходных переменных. Хотя в дальнейшем анализе используются только главные компоненты.

В факторный анализ с самого начала предполагает, что число извлеченных факторов будет существенно меньше числа первоначальных переменных. В факторном анализе извлеченные новые переменные-факторы в принципе не могут объяснить полностью суммарную дисперсию исходных переменных и их корреляции.

Компонентный анализ используют чаще как метод избавления от мультиколлинеарности объясняющих переменных в регрессионном анализе. Главные компоненты всегда не коррелированы между собой. Общие факторы могут быть коррелированными или слабо коррелированными между собой.

В факторном анализе делается больший акцент на интерпретации факторов. В компонентом анализе делается больший акцент на сокращение размерности пространства за счет некоррелированных переменных.

Вам может быть интересно .

Ссылка на основную публикацию
Adblock
detector