Рефераты. Психологическая интуиция искусственных нейронных сетей


В табл. ... N - общее количество объектов (испытуемых), p - общее количество признаков, xj - j-й признак, xij - значение j-го признака, измеренное у i-го объекта, X=( x1, ... , xp)T - вектор признаков, Xi=( xi1, ... , xip)T - i-й объект, X={ Xi} - множество объектов.

Исходные признаки xj, как правило, измерены в номинальных и порядковых (ординальных) шкалах [18],[82],[89]. Для большинства объективных методик нельзя априорно установить ни количественных отношений ни отношений порядка, поскольку их признаки представляют собой номинальные измерения. Зачастую при формализации тестовых методик применяют «дихотомизацию» [65] - процедуру преобразования исходных показателей в набор признаков с двумя градациями.

Для ординальных признаков существенен лишь порядок градаций на шкале, и для них считаются допустимыми любые монотонные преобразования не нарушающие этот порядок. Методически строгим является применение к ординальным признакам методов обработки, результат которых инвариантен относительно допустимых преобразований порядковой шкалы [49].

Далее, после сформирования таблицы экспериментальных данных, производится построение диагностической модели. Считается, что модель должна в определенной форме выражать зависимость между вектором входных признаков и тестируемым свойством (значение выраженности свойства далее будет обозначаться y). Модель должна отражать механизм преобразования y=y(x).

Предварительным этапом в построении диагностических моделей является как правило выяснение структуры таблицы экспериментальных данных. На этом этапе производится оценка корреляции между факторами и близости между объектами. Набор математических моделей и алгоритмов, используемых для этого, определяется исходя из специфики экспериментальных данных в психодиагностике.

Для определения степени связи между признаками используются [48],[65],[73]:

–Коэффициент корреляции Пирсона, являющийся мерой линейной связи двух переменных: , где  и . В рамках этого же подхода сконструированы коэффициент ранговой корреляции Спирмена, точечный бисериальный коэффициент корреляции и тетрахорический коэффициент корреляции.

–Коэффициент , предназначенный для измерения связи двух дихотомических признаков [73]. Коэффициент вычисляется на базе таблиц сопряженности признаков (см. табл. 2) по формуле .

Таблица 2

Таблица сопряженности дихотомических признаков


Признак

Признак

Итог


1

0


1

a

b

a+b

0

c

d

c+d

Итог

a+c

b+d



–Коэффициент ранговой корреляции «тау» Кенделла, основанный на подсчете числа несовпадений в ранжировке объектов по сопоставляемым переменным. Данный коэффициент разработан исходя из задачи истолкования процесса измерения связи между переменными без помощи принципа произведения моментов. Рассматриваются два признака   и , на каждый из которых N объектов отображаются в N последовательных рангов. Из N объектов формируется  пар. Тогда коэффициент вычисляется по формуле , где P - количество совпадений порядка на признаке  с порядком на признаке , Q - количество несовпадений.

Степень связи между признаками может быть использована для оценки избыточности набора признаков «черновой» модели, для взаимоконтроля шкал и т.п.

Для определения близости объектов используются различные меры расстояния:

*               Евклидово расстояние .

*               Взвешенное евклидово расстояние .

*               Расстояние Махаланобиса , где S - ковариационная матрица генеральной совокупности, из которой извлечены объекты  и .

*               Расстояние  Минковского  (городская метрика), применяющееся для измерения расстояния между объектами, описанными ординальными признаками.  равно разнице номеров градаций по k-му признаку у сравниваемых объектов  и .

*               Расстояние Хэмминга , которое используется для определения различий между объектами, задаваемыми дихотомическими признаками и интерпретируется как число несовпадений значений признаков у рассматриваемых объектов  и .

Полученная на основе какой-либо метрики (подробнее - [25], [48], [50]) информация о степени близости объектов может быть использована для выделения их группировок.

Представление информации о структуре экспериментальных данных служит промежуточным звеном в построении диагностической модели. Независимо от типа модели ее создание может опираться на два подхода:

1.Стратегия, основанная на автоинформативности экспериментальных данных.

Высокая степень близости между группой признаков может свидетельствовать о том, что признаки, вошедшие в группу, отражают эмпирический фактор, соответствующий диагностическому конструкту.

Выделение геометрических группировок в пространстве объектов может свидетельствовать о различии изучаемых объектов по тестируемому свойству, что позволяет строить диагностический алгоритм.

Для стратегий, основанных на автоинформативности экспериментальных данных, важной категорией является согласованность заданий теста.

Согласованность измеряемых реакций испытуемых на тестовые стимулы означает, что они должны иметь статистическую направленность на выражение общей, главной тенденции теста.

На стратегии, основанной на автоинформативности экспериментальных данных, строятся конструирование диагностического алгоритма при помощи метода главных компонент [17], [18], [19], факторного анализа [66] и метода контрастных групп [97].

2. Стратегия, основанная на критериях внешней информативности. Внешняя информация может быть представлена в виде привязки к объектам значений «зависимой» переменной, измеренной в количественной шкале, в виде номера однородного по тестируемому свойству класса, в виде порядкового номера (ранга) объекта в ряду всех объектов, упорядоченных по степени проявления диагностируемого свойства или в виде совокупности значений набора внешних (не включенных в таблицу экспериментальных данных) признаков, характеризующих тестируемый психологический феномен.

Методы, основанные на внешней информативности признаков принято подразделять на  экспертные, экспериментальные и жизненные.

К числу экспертных критериев относят оценки, суждения, заключения об испытуемых, вынесенные одним экспертом или их группой.

Экспериментальными критериями служат результаты одновременного и независимого исследования испытуемого другим тестом, который считается апробированным и измеряющим то же свойство, что и конструируемый тест.

В качестве жизненных критериев используются объективные социально - демографические и биографические данные.

На стратегии, основанной на внешней информативности экспериментальных данных, строятся конструирование диагностического алгоритма при помощи регрессионного анализа, дискриминантного анализа [49] и типологического подхода [60], [99].

Наиболее широко в настоящее время употребляются линейные диагностические модели. Однако в условиях неоднородности обучающей выборки они обладают практической успешностью не выше 70-80% [60].

Построенная диагностическая модель может считаться психодиагностическим тестом только после прохождения ею испытаний на предмет проверки психометрических свойств - надежности и валидности [20],[27].

Надежность теста - характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к воздействию посторонних случайных факторов [27].

Валидность - мера соответствия тестовых оценок представлениям о сущности свойств или их роли в той или иной деятельности [60].


1.4 перспективные алгоритмы построения психодиагностических методик


Перспективным направлением в построении психодиагностических методик в настоящее время считается использование аппарата теории распознавания образов [2], [13], [47].

Классификация методов распознавания образов многообразна. Выделяются параметрические, непараметрические и эвристические методы, существуют классификации основанные на терминологии сложившихся научных школ. В [52] методы распознавания образов классифицируются следующим образом:

–методы, основанные на принципе разделения;

–статистические методы;

–методы типа «потенциальных функций»;

–методы вычисления оценок (голосования);

–методы, основанные на аппарате исчисления высказываний.

Кроме того существенным для метода, основанного на теории распознавания образов, может быть способ представления знаний. В настоящее время выделяют два основных способа [78]:

                   Интенсиональные представления - схемы связей между атрибутами (признаками)

                   Экстенсиональные представления - конкретные факты (объекты, примеры).

Группа интенсиональных методов распознавания образов включает в себя следующие подклассы:

1)  Методы, основанные на оценках плотностей распределения значений признаков (методы непараметрической статистики) [18].

2)  Методы, основанные на предположениях о классе решающих функций (методы, использующие в качестве решающего алгоритма минимизацию функционала риска или ошибки) [6], [15],[36], [41], [94].

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.