Корреляции в дипломных работах по психологии.

Корреляционный метод.

Чтобы преодолеть ограничения метода клинических случаев, исследователи личности часто используют альтернативную стратегию, известную как корреляционный метод .Этот метод стремится установить взаимосвязи между событиями (переменными) и внутри них. Переменная - любая величина, которая может быть измерена и чье количественное выражение может варьировать в переделах того или иного континуума. Например, тревожность - переменная, потому что ее можно измерить (с помощью шкалы самооценки тревоги) и потому что люди различаются по степени выраженности у них тревожности. Сходным образом точность выполнения задания, требующего определенного навыка, тоже является переменной, которую можно измерить. Корреляционное исследование можно провести, просто измерив уровень тревожности у некоторого числа людей, а также уровень точности действий каждого из них при выполнении группой сложного задания. Если опубликованные результаты подтвердятся в другом исследовании, то можно будет считать, что субъекты с более низкими показателями тревожности имеют более высокие показатели точности выполнения задания. Поскольку на точность выполнения задания, вероятно, влияют и другие факторы (например, прежний опыт его выполнения, мотивация, интеллект), связь между точностью действий и тревожностью не будет безупречной, но она будет заслуживать внимания.

Переменными в корреляционном исследовании могут быть данные тестирования, демографические характеристики (такие как возраст, порядок рождения и социально-экономический статус), результаты измерения черт характера по методу самооценки, мотивы, ценности и установки, физиологические реакции (такие как частота сердечных сокращений, артериальное давление и кожно-гальваническая реакция), а также стили поведения. При использовании корреляционного метода психологи хотят получить ответы на такие специфические вопросы, как: влияет ли высшее образование на профессиональный успех в будущем? имеет ли отношение стресс к коронарной болезни сердца? есть ли взаимосвязь между самооценкой и одиночеством? есть ли связь между порядковым номером рождения и мотивацией достижения? Корреляционный метод не только позволяет ответить «да» или «нет» на эти вопросы, но также дать количественную оценку соответствия значений одной переменной значениям другой переменной. Для решения этой задачи психологи вычисляют статистический индекс, называемый коэффициентом корреляции (известен также как коэффициент линейной корреляции по Пирсону). Коэффициент корреляции (обозначается маленькой буквой r )показывает нам две вещи: 1) степень зависимости двух переменных и 2) направление этой зависимости (прямая или обратная зависимость).

Численное значение коэффициента корреляции варьирует от -1 (полностью отрицательная, или обратная зависимость) через 0 (отсутствие связи) до +1 (полностью положительная, или прямая зависимость). Коэффициент, близкий по значению к нулю, означает, что две измеряемые переменные не связаны сколько-нибудь заметным образом. То есть большие или малые значения переменной X не имеют значимой связи с большими или малыми значениями переменной Y . В качестве примера приведем связь между двумя переменными: массой тела и интеллектом. В целом, полные люди не являются значимо более интеллектуальными или значимо менее интеллектуальными, чем более худощавые люди. И, наоборот, коэффициент корреляции +1 или -1 говорит о полном, однозначном соответствии между двумя переменными. Корреляции, близкие к полным, почти никогда не встречаются в исследовании личности, и это заставляет предположить, что хотя многие психологические переменные и связаны друг с другом, степень связи между ними не является столь уж сильной. Значение коэффициента корреляции в пределах между ±0,30 и ±0,60 является общераспространенным в исследовании личности и представляет практическую и теоретическую ценность для научного прогнозирования. К значениям коэффициента корреляции между 0 и ±0,30 следует относиться с осторожностью - их ценность для научных предсказаний минимальна. На рис. 2-2 представлены графики распределения значений двух переменных при двух различных значениях коэффициента корреляции. По горизонтали расположены значения одной переменной, а по вертикали - другой. Каждая точка означает баллы, полученные одним испытуемым по двум переменным.

Рис. 2-2. Каждая из диаграмм иллюстрирует различную степень зависимости значений двух переменных. Каждая точка па диаграмме представляет собой показатели испытуемого по двум переменным: a - полная положительная корреляция (r = +1); b - полная отрицательная корреляция (r = -1); с - умеренная положительная корреляция (r = +0,71); d - корреляция отсутствует (r = 0).

Положительная корреляция означает, что большие значения одной переменной имеют тенденцию быть связанными с большими значениями другой переменной или малые значения одной переменной - с малыми значениями другой переменной. Другими словами, две переменные увеличиваются или уменьшаются вместе. Например, существует положительная корреляция между ростом и массой тела людей. В целом, у более высоких людей есть тенденция иметь большую массу тела, чем у более низких. Другой пример положительной корреляции - связь между количеством сцен насилия, которые видят дети в телевизионных передачах и их тенденцией вести себя агрессивно. В среднем, чем чаще дети наблюдают насилие по телевизору, тем чаще они демонстрируют агрессивное поведение. Отрицательная корреляция означает, что высокие значения одной переменной связаны с низкими значениями другой переменной и наоборот.

Примером отрицательной корреляции может служить связь между частотой отсутствия студентов в аудитории и успешностью сдачи ими экзаменов. В целом, студенты, имевшие большее количество пропущенных занятий, проявляют тенденцию к получению более низких оценок на экзаменах. Студенты, имевшие меньшее количество пропусков, получали более высокие экзаменационные баллы. Другой пример - отрицательная корреляция между робостью и напористым поведением. Лица, получившие высокие баллы по показателю робости, имели склонность к нерешительному поведению, в то время как лица с низкими показателями робости проявляли себя решительными и напористыми. Чем ближе значение коэффициента корреляции к +1 или к -1, тем сильнее связь между двумя изучаемыми переменными. Так, коэффициент корреляции +0,80 отражает наличие более сильной зависимости между двумя переменными, чем коэффициент корреляции +0,30. Сходным образом, коэффициент корреляции -0,65 отражает более сильную взаимосвязь переменных, чем коэффициент корреляции -0,25. Надо иметь в виду, что величина корреляции зависит только от числового значения коэффициента, в то время как знак «+» или «-», стоящий перед коэффициентом, просто обозначает положительная это корреляция или отрицательная. Так, значение r = +0,70 отражает наличие такой же сильной зависимости, как и значение r = -0,70. Но первый пример указывает на положительную зависимость, а второй - на отрицательную. Далее, коэффициент корреляции -0,55 указывает на более сильную зависимость, чем коэффициент корреляции +0,35. Понимание этих аспектов корреляционной статистики поможет вам оценивать результаты исследований такого рода.

Чтобы преодолеть ограничения метода клинических случаев, исследователи личности часто используют альтернативную стратегию, известную как корреляционный метод . Этот метод стремится установить взаимосвязи между событиями (переменными) и внутри них. Переменная - любая величина, которая может быть измерена и чье количественное выражение может варьировать в переделах того или иного континуума. Например, тревожность - переменная, потому что ее можно измерить (с помощью шкалы самооценки тревоги) и потому что люди различаются по степени выраженности у них тревожности. Сходным образом точность выполнения задания, требующего определенного навыка, тоже является переменной, которую можно измерить. Корреляционное исследование можно провести, просто измерив уровень тревожности у некоторого числа людей, а также уровень точности действий каждого из них при выполнении группой сложного задания. Если опубликованные результаты подтвердятся в другом исследовании, то можно будет считать, что субъекты с более низкими показателями тревожности имеют более высокие показатели точности выполнения задания. Поскольку на точность выполнения задания, вероятно, влияют и другие факторы (например, прежний опыт его выполнения, мотивация, интеллект), связь между точностью действий и тревожностью не будет безупречной, но она будет заслуживать внимания.

Переменными в корреляционном исследовании могут быть данные тестирования, демографические характеристики (такие как возраст, порядок рождения и социально-экономический статус), результаты измерения черт характера по методу самооценки, мотивы, ценности и установки, физиологические реакции (такие как частота сердечных сокращений, артериальное давление и кожно-гальваническая реакция), а также стили поведения. При использовании корреляционного метода психологи хотят получить ответы на такие специфические вопросы, как: влияет ли высшее образование на профессиональный успех в будущем? имеет ли отношение стресс к коронарной болезни сердца? есть ли взаимосвязь между самооценкой и одиночеством? есть ли связь между порядковым номером рождения и мотивацией достижения? Корреляционный метод не только позволяет ответить "да" или "нет" на эти вопросы, но также дать количественную оценку соответствия значений одной переменной значениям другой переменной. Для решения этой задачи психологи вычисляют статистический индекс, называемый коэффициентом корреляции (известен также как коэффициент линейной корреляции по Пирсону). Коэффициент корреляции (обозначается маленькой буквой r ) показывает нам две вещи: 1) степень зависимости двух переменных и 2) направление этой зависимости (прямая или обратная зависимость).

Численное значение коэффициента корреляции варьирует от -1 (полностью отрицательная, или обратная зависимость) через 0 (отсутствие связи) до +1 (полностью положительная, или прямая зависимость). Коэффициент, близкий по значению к нулю, означает, что две измеряемые переменные не связаны сколько-нибудь заметным образом. То есть большие или малые значения переменной X не имеют значимой связи с большими или малыми значениями переменной Y . В качестве примера приведем связь между двумя переменными: массой тела и интеллектом. В целом, полные люди не являются значимо более интеллектуальными или значимо менее интеллектуальными, чем более худощавые люди. И, наоборот, коэффициент корреляции +1 или -1 говорит о полном, однозначном соответствии между двумя переменными. Корреляции, близкие к полным, почти никогда не встречаются в исследовании личности, и это заставляет предположить, что хотя многие переменные и связаны друг с другом, степень связи между ними не является столь уж сильной. Значение коэффициента корреляции в пределах между ±0,30 и ±0,60 является общераспространенным в исследовании личности и представляет практическую и теоретическую ценность для научного прогнозирования. К значениям коэффициента корреляции между 0 и ±0,30 следует относиться с осторожностью - их ценность для научных предсказаний минимальна. На рис. 2-2 представлены графики распределения значений двух переменных при двух различных значениях коэффициента корреляции. По горизонтали расположены значения одной переменной, а по вертикали - другой. Каждая точка означает баллы, полученные одним испытуемым по двум переменным.

Рис. 2-2. Каждая из диаграмм иллюстрирует различную степень зависимости значений двух переменных. Каждая точка па диаграмме представляет собой показатели испытуемого по двум переменным: a - полная положительная корреляция (r = +1); b - полная отрицательная корреляция (r = -1); с - умеренная положительная корреляция (r = +0,71); d - корреляция отсутствует (r = 0).

Положительная корреляция означает, что большие значения одной переменной имеют тенденцию быть связанными с большими значениями другой переменной или малые значения одной переменной - с малыми значениями другой переменной. Другими словами, две переменные увеличиваются или уменьшаются вместе. Например, существует положительная корреляция между ростом и массой тела людей. В целом, у более высоких людей есть тенденция иметь большую массу тела, чем у более низких. Другой пример положительной корреляции - связь между количеством сцен насилия, которые видят дети в телевизионных передачах и их тенденцией вести себя агрессивно. В среднем, чем чаще дети наблюдают насилие по телевизору, тем чаще они демонстрируют агрессивное поведение. Отрицательная корреляция означает, что высокие значения одной переменной связаны с низкими значениями другой переменной и наоборот.

Примером отрицательной корреляции может служить связь между частотой отсутствия студентов в аудитории и успешностью сдачи ими экзаменов. В целом, студенты, имевшие большее количество пропущенных занятий, проявляют тенденцию к получению более низких оценок на экзаменах. Студенты, имевшие меньшее количество пропусков, получали более высокие экзаменационные баллы. Другой пример - отрицательная корреляция между робостью и напористым поведением. Лица, получившие высокие баллы по показателю робости, имели склонность к нерешительному поведению, в то время как лица с низкими показателями робости проявляли себя решительными и напористыми. Чем ближе значение коэффициента корреляции к +1 или к -1, тем сильнее связь между двумя изучаемыми переменными. Так, коэффициент корреляции +0,80 отражает наличие более сильной зависимости между двумя переменными, чем коэффициент корреляции +0,30. Сходным образом, коэффициент корреляции -0,65 отражает более сильную взаимосвязь переменных, чем коэффициент корреляции -0,25. Надо иметь в виду, что величина корреляции зависит только от числового значения коэффициента, в то время как знак "+" или "-", стоящий перед коэффициентом, просто обозначает положительная это корреляция или отрицательная. Так, значение r = +0,70 отражает наличие такой же сильной зависимости, как и значение r = -0,70. Но первый пример указывает на положительную зависимость, а второй - на отрицательную. Далее, коэффициент корреляции -0,55 указывает на более сильную зависимость, чем коэффициент корреляции +0,35. Понимание этих аспектов корреляционной статистики поможет вам оценивать результаты исследований такого рода.

Оценка корреляционного метода.

Корреляционный метод обладает некоторыми уникальными преимуществами. Наиболее важным является то, что он позволяет исследователям изучать большой набор переменных, которые недоступны проверке с помощью экспериментальных исследований. Например, когда речь идет об установлении связи между сексуальным насилием, перенесенным в детстве, и эмоциональными проблемами в более поздние годы жизни, корреляционный анализ может стать единственным этически приемлемым способом исследования. Аналогично, чтобы изучить, как демократический и авторитарный стили родительского воспитания соотносятся с ценностными ориентациями человека, стоит выбрать этот метод, поскольку этические соображения не дают возможности экспериментально контролировать стиль родительского воспитания.

Второе преимущество корреляционного метода состоит в том, что он дает возможность изучать многие аспекты личности в естественных условиях реальной жизни. Например, если мы хотим оценить влияние развода родителей на адаптацию и поведение детей в школе, мы должны систематически отслеживать социальные и академические успехи детей из распавшихся семей в течение определенного периода времени. Проведение подобного естественного наблюдения потребует времени и усилий, но позволит дать вполне реалистичную оценку сложного поведения. По этой причине корреляционный метод является предпочтительной исследовательской стратегией для персонологов, заинтересованных в изучении индивидуальных различий и феноменов, поддающихся экспериментальному контролю. Третье преимущество корреляционного метода заключается в том, что иногда с его помощью становится возможным предсказать некое событие, зная другое. Например, в исследовании получена умеренно высокая положительная корреляция между оценками по SAT 4 у старшеклассников и их же оценками, полученными позднее в колледже (Hargadon, 1981). Поэтому, зная баллы студентов по SAT, приемная комиссия в колледже может достаточно точно предсказать их последующую успеваемость. Подобные предсказания никогда не бывают совершенными, но часто оказываются полезными для решения вопроса о приеме в учебное заведение. Тем не менее, все исследователи личности признают два серьезных недостатка этой стратегии. Во-первых, применение корреляционного метода не позволяет исследователям выделять причинно-следственные отношения. Суть проблемы состоит в том, что корреляционное исследование не может дать окончательное заключение о том, что две переменные причинно связаны . Например, во многих корреляционных исследованиях подтверждается связь между просмотром телевизионных программ с эпизодами насилия и агрессивным поведением у части детей и взрослых зрителей (Freedman, 1988; Huston, Wright, 1982). Какой вывод можно сделать из этих работ? Одно из возможных заключений таково: просмотр в течение длительного времени сцен насилия по телевидению ведет к возрастанию у зрителя агрессивных побуждений. Но возможен и противоположный вывод: агрессивные по складу своего характера субъекты или те, кто совершали агрессивные действия, предпочитают смотреть телевизионные программы со сценами насилия. К сожалению, корреляционный метод не позволяет установить, какое из этих двух объяснений верно. В то же время, корреляционные исследования, в которых устанавливается сильная корреляционная зависимость между значениями двух переменных, поднимает вопрос о возможности наличия причинно обусловленной связи между этими переменными. Что касается, например, связи между просмотром сцен насилия по телевидению и агрессией, то экспериментальное исследование, проведенное вслед за полученными результатами корреляционного анализа, привело ученых к заключению, что экспозиция программ, содержащих сцены насилия, может быть причиной агрессивного поведения (Eron, 1987).

4 Scholastic Attitude Test - программа для оценки способностей к обучению. См. Анастази А. Психологическое тестирование / Под ред. К. М. Гуревича, В. И. Лубовского. М., 1982. - Кн. 2. - С. 48. (Прим. науч. ред.)

Второй недостаток корреляционного метода - возможная путаница, вызванная действием третьей переменной. Для иллюстрации рассмотрим зависимость между употреблением наркотиков подростками и их родителями. Означает ли наличие корреляционной зависимости, что подростки, видя, как родители принимают наркотики, сами начинают употреблять их в еще большем количестве? Или это значит, что беспокойство при виде того, как их дети-подростки принимают наркотики, заставляет самих родителей прибегать к наркотикам, чтобы тем самым уменьшить свою тревогу? Или какой-то третий фактор сходным образом толкает подростков и взрослых к употреблению наркотиков? Может быть, подростки и их родители принимают наркотики, чтобы смириться с угнетающей нищетой, в которой они живут? То есть истинной причиной, обусловливающей наркоманию, может быть социально-экономический статус семей (например, бедность). Вероятность того, что третья переменная, которая не измеряется и о которой, может быть, даже и не подозревают, в действительности оказывает причинное влияние на обе измеряемые переменные, нельзя исключать при интерпретации результатов, полученных с помощью корреляционного метода.

Хотя корреляционный метод не предполагает установления причинно-следственной связи, из этого не следует, что причинно-следственные отношения в определенных случаях не могут быть четко установлены. Последнее особенно верно в отношении лонгитюдных корреляционных исследований - где, например, интересующие нас переменные, измеренные в одно время, коррелируют с другими переменными, о которых известно, что они появляются вслед за первыми. Рассмотрим, например, хорошо известную положительную корреляцию между курением сигарет и раком легких. Несмотря на возможность того, что какая-то третья неизвестная переменная (например, генетическая предрасположенность) может служить причиной и курения, и рака легких, мало кто сомневается, что весьма вероятная причина рака - курение, так как по времени курение предшествует заболеванию раком легких. Подобная стратегия (измерение двух переменных, разделенное определенным промежутком времени) дает возможность исследователям устанавливать причинно-следственные отношения в случаях, когда невозможно провести эксперимент. Например, на основе клинических наблюдений исследователи в течение долгого времени подозревали, что хронический стресс способствует развитию многих физиологических и проблем. Недавние работы по измерению силы стресса (с использованием шкал самооценки) позволили проверить эти предположения с применением корреляционного метода. В области физиологических расстройств, например, накопленные данные свидетельствуют о следующем: стресс значимо связан с возникновением и развитием сердечно-сосудистых заболеваний, диабета, рака и различных типов инфекционных заболеваний (Elliott, Eisdorfer, 1982; Friedman, Booth-Kelley, 1987; Jemmott, Locke, 1984; Smith, Anderson, 1986; Williams, Deffenbacher, 1983). Корреляционный анализ также показал, что стресс может способствовать формированию зависимости от наркотиков (Newcomb, Harlow, 1986), сексуальных расстройств (Malatesta, Adams, 1984), а также возникновению многочисленных психических нарушений (Neufeld, Mothersill, 1980). Тем не менее, критики корреляционного подхода справедливо замечают, что могут существовать и другие факторы, искусственно усиливающие предположительную связь между стрессом и болезнью (Schroeder, Costa, 1984). Таким образом, одно предостережение остается: хотя иногда при наличии сильной корреляционной зависимости между двумя переменными напрашивается вывод о наличии причинной связи между ними, в действительности установить причинно-следственные отношения можно только экспериментальными методами.

В научных исследованиях часто возникает необходимость в нахождении связи между результативными и факторными переменными (урожайностью какой-либо культуры и количеством осадков, ростом и весом человека в однородных группах по полу и возрасту, частотой пульса и температурой тела и т.д.).

Вторые представляют собой признаки, способствующие изменению таковых, связанных с ними (первыми).

Понятие о корреляционном анализе

Существует множество Исходя из вышеизложенного, можно сказать, что корреляционный анализ — это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять.

Есть и другие определения рассматриваемого понятия. Корреляционный анализ — это метод обработки заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков, для установления между ними статистических взаимосвязей. Корреляционный анализ — это метод по изучению статистической зависимости между случайными величинами с необязательным наличием строгого функционального характера, при которой динамика одной случайной величины приводит к динамике математического ожидания другой.

Понятие о ложности корреляции

При проведении корреляционного анализа необходимо учитывать, что его можно провести по отношению к любой совокупности признаков, зачастую абсурдных по отношению друг к другу. Порой они не имеют никакой причинной связи друг с другом.

В этом случае говорят о ложной корреляции.

Задачи корреляционного анализа

Исходя из приведенных выше определений, можно сформулировать следующие задачи описываемого метода: получить информацию об одной из искомых переменных с помощью другой; определить тесноту связи между исследуемыми переменными.

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи с чем задачи корреляционного анализа можно дополнить следующими:

  • выявление факторов, оказывающих наибольшее влияние на результативный признак;
  • выявление неизученных ранее причин связей;
  • построение корреляционной модели с ее параметрическим анализом;
  • исследование значимости параметров связи и их интервальная оценка.

Связь корреляционного анализа с регрессионным

Метод корреляционного анализа часто не ограничивается нахождением тесноты связи между исследуемыми величинами. Иногда он дополняется составлением уравнений регрессии, которые получают с помощью одноименного анализа, и представляющих собой описание корреляционной зависимости между результирующим и факторным (факторными) признаком (признаками). Этот метод в совокупности с рассматриваемым анализом составляет метод

Условия использования метода

Результативные факторы зависят от одного до нескольких факторов. Метод корреляционного анализа может применяться в том случае, если имеется большое количество наблюдений о величине результативных и факторных показателей (факторов), при этом исследуемые факторы должны быть количественными и отражаться в конкретных источниках. Первое может определяться нормальным законом — в этом случае результатом корреляционного анализа выступают коэффициенты корреляции Пирсона, либо, в случае, если признаки не подчиняются этому закону, используется коэффициент ранговой корреляции Спирмена.

Правила отбора факторов корреляционного анализа

При применении данного метода необходимо определиться с факторами, оказывающими влияние на результативные показатели. Их отбирают с учетом того, что между показателями должны присутствовать причинно-следственные связи. В случае создания многофакторной корреляционной модели отбирают те из них, которые оказывают существенное влияние на результирующий показатель, при этом взаимозависимые факторы с коэффициентом парной корреляции более 0,85 в корреляционную модель предпочтительно не включать, как и такие, у которых связь с результативным параметром носит непрямолинейный или функциональный характер.

Отображение результатов

Результаты корреляционного анализа могут быть представлены в текстовом и графическом видах. В первом случае они представляются как коэффициент корреляции, во втором — в виде диаграммы разброса.

При отсутствии корреляции между параметрами точки на диаграмме расположены хаотично, средняя степень связи характеризуется большей степенью упорядоченности и характеризуется более-менее равномерной удаленностью нанесенных отметок от медианы. Сильная связь стремится к прямой и при r=1 точечный график представляет собой ровную линию. Обратная корреляция отличается направленностью графика из левого верхнего в нижний правый, прямая — из нижнего левого в верхний правый угол.

Трехмерное представление диаграммы разброса (рассеивания)

Помимо традиционного 2D-представления диаграммы разброса в настоящее время используется 3D-отображение графического представления корреляционного анализа.

Также используется матрица диаграммы рассеивания, которая отображает все парные графики на одном рисунке в матричном формате. Для n переменных матрица содержит n строк и n столбцов. Диаграмма, расположенная на пересечении i-ой строки и j-ого столбца, представляет собой график переменных Xi по сравнению с Xj. Таким образом, каждая строка и столбец являются одним измерением, отдельная ячейка отображает диаграмму рассеивания двух измерений.

Оценка тесноты связи

Теснота корреляционной связи определяется по коэффициенту корреляции (r): сильная — r = ±0,7 до ±1, средняя — r = ±0,3 до ±0,699, слабая — r = 0 до ±0,299. Данная классификация не является строгой. На рисунке показана несколько иная схема.

Пример применения метода корреляционного анализа

В Великобритании было предпринято любопытное исследование. Оно посвящено связи курения с раком легких, и проводилось путем корреляционного анализа. Это наблюдение представлено ниже.

Исходные данные для корреляционного анализа

Профессиональная группа

смертность

Фермеры, лесники и рыбаки

Шахтеры и работники карьеров

Производители газа, кокса и химических веществ

Изготовители стекла и керамики

Работники печей, кузнечных, литейных и прокатных станов

Работники электротехники и электроники

Инженерные и смежные профессии

Деревообрабатывающие производства

Кожевенники

Текстильные рабочие

Изготовители рабочей одежды

Работники пищевой, питьевой и табачной промышленности

Производители бумаги и печати

Производители других продуктов

Строители

Художники и декораторы

Водители стационарных двигателей, кранов и т. д.

Рабочие, не включенные в другие места

Работники транспорта и связи

Складские рабочие, кладовщики, упаковщики и работники разливочных машин

Канцелярские работники

Продавцы

Работники службы спорта и отдыха

Администраторы и менеджеры

Профессионалы, технические работники и художники

Начинаем корреляционный анализ. Решение лучше начинать для наглядности с графического метода, для чего построим диаграмму рассеивания (разброса).

Она демонстрирует прямую связь. Однако на основании только графического метода сделать однозначный вывод сложно. Поэтому продолжим выполнять корреляционный анализ. Пример расчета коэффициента корреляции представлен ниже.

С помощью программных средств (на примере MS Excel будет описано далее) определяем коэффициент корреляции, который составляет 0,716, что означает сильную связь между исследуемыми параметрами. Определим статистическую достоверность полученного значения по соответствующей таблице, для чего нам нужно вычесть из 25 пар значений 2, в результате чего получим 23 и по этой строке в таблице найдем r критическое для p=0,01 (поскольку это медицинские данные, здесь используется более строгая зависимость, в остальных случаях достаточно p=0,05), которое составляет 0,51 для данного корреляционного анализа. Пример продемонстрировал, что r расчетное больше r критического, значение коэффициента корреляции считается статистически достоверным.

Использование ПО при проведении корреляционного анализа

Описываемый вид статистической обработки данных может осуществляться с помощью программного обеспечения, в частности, MS Excel. Корреляционный предполагает вычисление следующих парамет-ров с использованием функций:

1. Коэффициент корреляции определяется с помощью функции КОРРЕЛ (массив1; массив2). Массив1,2 — ячейка интервала значений результативных и факторных переменных.

Линейный коэффициент корреляции также называется коэффициентом корреляции Пирсона, в связи с чем, начиная с Excel 2007, можно использовать функцию с теми же массивами.

Графическое отображение корреляционного анализа в Excel производится с помощью панели «Диаграммы» с выбором «Точечная диаграмма».

После указания исходных данных получаем график.

2. Оценка значимости коэффициента парной корреляции с использованием t-критерия Стьюдента. Рассчитанное значение t-критерия сравнивается с табличной (критической) величиной данного показателя из соответствующей таблицы значений рассматриваемого параметра с учетом заданного уровня значимости и числа степеней свободы. Эта оценка осуществляется с использованием функции СТЬЮДРАСПОБР (вероятность; степени_свободы).

3. Матрица коэффициентов парной корреляции. Анализ осуществляется с помощью средства «Анализ данных», в котором выбирается «Корреляция». Статистическую оценку коэффициентов парной корреляции осуществляют при сравнении его абсолютной величины с табличным (критическим) значением. При превышении расчетного коэффициента парной корреляции над таковым критическим можно говорить, с учетом заданной степени вероятности, что нулевая гипотеза о значимости линейной связи не отвергается.

В заключение

Использование в научных исследованиях метода корреляционного анализа позволяет определить связь между различными факторами и результативными показателями. При этом необходимо учитывать, что высокий коэффициент корреляции можно получить и из абсурдной пары или множества данных, в связи с чем данный вид анализа нужно осуществлять на достаточно большом массиве данных.

После получения расчетного значения r его желательно сравнить с r критическим для подтверждения статистической достоверности определенной величины. Корреляционный анализ может осуществляться вручную с использованием формул, либо с помощью программных средств, в частности MS Excel. Здесь же можно построить диаграмму разброса (рассеивания) с целью наглядного представления о связи между изучаемыми факторами корреляционного анализа и результативным признаком.

При проведении исследования в биологии или медицине, как правило, регистрируются множество учетных признаков. Представляет интерес вопрос об их взаимном изменении, т.е. обнаружение зависимостей между ними. Выявление наличия таких взаимосвязей является одной из важнейших задач любой науки, в том числе и медицины.

Различают две формы количественных связей между явлениями или процессами: функциональную и корреляционную . Под ФУНКЦИОНАЛЬНОЙ понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого. В точных науках, таких, как физика, химия и другие, может быть установлена функциональная взаимосвязь. Например, зависимость площади круга от длины окружности в геометрии, или в физике длина пути, пройденной телом в свободном падении, от времени. Наиболее известным видом функциональной зависимости является линейная, которая выражается математической формулой: y = ax+b .

В биологии и медицине установить функциональную зависимость, как правило, не удается. Объекты этих исследований имеют большую изменчивость и зависят от огромного числа факторов, измерить которые просто невозможно. В этом случае определяется наличие КОРРЕЛЯЦИОННОЙ связи, при которой значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака. Например: связь между ростом и массой тела человека. У группы людей с одинаковым ростом наблюдается различная масса тела, однако она варьирует в определенных пределах вокруг средней величины. Поэтому такую зависимость нужно оценивать с использованием понятия случайной величины с привлечением подходов теории вероятности. Такую форму зависимостей называют «Корреляционной».

При поиске зависимости между признаками может быть обнаружена взаимосвязь, различная по направлению и силе:

Прямая (при увеличении одного признака увеличивается второй);

Обратная (при увеличении одного признака второй уменьшается).

Степень взаимосвязи признаков по силе (тесноте) принято обозначать как:

Отсутствие;

Средняя;

Сильная;

Способами выявления корреляционной взаимосвязи между признаками являются:

Визуальные (таблицы и графики).

Статистические (корреляция и регрессия).

Следует подчеркнуть, что обнаружение корреляции между двумя признаками еще не говорит о существовании причинной связи между ними, а лишь указывает на возможность таковой или на наличие фактора, определяющего изменение обеих переменных совместно.

Приёмы визуализации данных позволяют обнаружить корреляционную зависимость лишь при небольшом числе наблюдений и только приблизительно. Для обнаружения корреляционной взаимосвязи с помощью таблицы в ней располагают ранжированные вариационные ряды и затем определяют совместное изменение признаков. График более наглядно демонстрирует такую зависимость и позволяет оценить ее форму: линейная, параболическая, тригонометрическая и др.



Наиболее точным способом обнаружения взаимосвязи между признаками является вычисление коэффициента корреляции . В зависимости от природы обрабатываемых данных применяются параметрические или непараметрические методы вычисления этого коэффициента.

При вычислении коэффициента корреляции исследователь получает возможность судить о силе связи (степени сопряженности) и ее направлении, а также с требуемой долей вероятности делать вывод о проявлении этой связи в генеральной совокупности. Чем больше коэффициент корреляции, тем с большей степенью уверенности можно говорить о наличии корреляционной зависимости между признаками. Если каждому заданному значению одного признака соответствуют близкие друг к другу, тесно расположенные около средней величины значения другого признака, то связь является более тесной. Когда эти значения сильно варьируют, связь менее тесная. Таким образом, мера корреляции указывает, насколько тесно связаны между собой параметры.

Коэффициент корреляции может принимать значения от -1 до +1. Направление обнаруженной взаимосвязи определяют по знаку коэффициента корреляции. При его положительном значении обнаруженная связь является прямой, при отрицательном – обратной. Сила связи оценивается по модулю этого коэффициента. Условно выделяют следующие уровни корреляционной связи: отсутствие – 0; слабая – от 0 до 0,3; средняя – от 0,3 до 0,7; сильная – 0,7 и более; полная – 1. Однако обсуждать наличие корреляции имеет смысл только в тех случаях, когда она статистически значима (p <0,05). Поэтому после вычисления коэффициента корреляции производится определение его ошибки репрезентативности и критерия достоверности.

Наиболее часто применяемыми в настоящее время методами обнаружения корреляции являются параметрический анализ по Пирсону и непараметрический анализ по Спирмену. Этими методами проверяется нулевая гипотеза (H 0 ) об отсутствии связи между параметрами. Если такая гипотеза отклоняется при заданном уровне значимости (p ), можно говорить о наличии взаимосвязи между параметрами.

Корреляционный анализ по Пирсону используется при решении задачи исследования линейной связи двух нормально распределенных параметров. Кроме проверки на нормальность распределения каждого параметра, до проведения корреляционного анализа рекомендуется строить график в координатах оцениваемых параметров, чтобы визуально определить характер зависимости.

Коэффициент корреляции Пирсона (r xy ) или коэффициент линейной корреляции, был разработан в 90-х годах XIX века Карлом Пирсон, Фрэнсисом Эджуортом и Рафаэлем Уэлдоном в Англии. Он рассчитывается по формуле:

где: r xy

cov XY – ковариация признаков X и Y ;

σ X X ;

σ Y – среднее квадратическое отклонение признака Y;

X ;

– средняя арифметическая признака Y .

В медицинской литературе встречается упрощенная запись этой формулы:

где: r xy – коэффициент линейной корреляции Пирсона;

d x x от средней этого признака: d x = x - M x ,

d y – отклонение каждой варианты признака y от средней этого признака: d y = y - M y .

В программе Excel значение коэффициент линейной корреляции Пирсона может быть вычислено функцией = КОРРЕЛ(Диапазон ячеек 1-го ряда; Диапазон ячеек 2-го ряда).

Для прогнозирования уровня корреляции в генеральной совокупности определяют ошибку репрезентативности этого коэффициента m r . Она вычисляется по формуле:

,

где: m r – ошибка репрезентативности коэффициента корреляции;

r xy – коэффициент линейной корреляции Пирсона;

n – число парных вариант.

Достоверность коэффициента линейной корреляции оценивается по коэффициенту Стьюдента (t r ), который вычисляется с использованием его ошибки:

где: t r

r xy – коэффициент линейной корреляции Пирсона;

m r – ошибка репрезентативности коэффициента корреляции.

Если число парных вариант n >30, то при t r >2 связь считается достоверной при уровне значимости p <0,05. Если число парных вариант n <30, то критическое значение t r-Крит. находят по таблице критических значений Стьюдента при степени свободы df = n - 2 . В программе Excel это значение вычисляется функцией = СТЬЮДРАСПОБР(Уровень значимости p ; Степени свободыdf ).

С целью уменьшения объема вычислений может применяться функция =КОРРЕЛ(Диапазон1; Диапазон2) или надстройка «Анализ данных» и ее модуль «Корреляционный анализ».

Отсутствие линейной корреляции еще не означает, что параметры полностью независимы. Связь между ними может быть нелинейной, или признаки, используемые в вычислениях, могут не подчиняться нормальному закону распределения. Поэтому, помимо вычисления коэффициента линейной корреляции, прибегают к использованию непараметрических коэффициентов корреляции. К ним относятся:

Коэффициент ранговой корреляции Спирмена;

Коэффициент ранговой корреляции Кендалла;

Коэффициент корреляции знаков Фехнера;

Коэффициент множественной ранговой корреляции (конкордации).

Корреляционный анализ по Спирмену применяется для обнаружения взаимосвязи двух параметров, если распределение хотя бы одного из них отлично от нормального.

Каждому показателю x и y присваивается ранг. На основе полученных рангов рассчитываются их разности d. Затем вычисляется коэффициент корреляции (ρ ) по формуле:

где: r

d – разность рангов;

n – число парных вариант.

Ошибка репрезентативности коэффициента корреляции Спирмена определяется по формуле:

,

а коэффициент достоверности Стьюдента:

где: t r – коэффициент достоверности Стьюдента;

r – коэффициент корреляции Спирмена;

m r – ошибка репрезентативности коэффициента корреляции Спирмена.

Оценка коэффициента корреляции Спирмена и его достоверности выполняется так же, как и коэффициента линейной корреляции Пирсона.

Корреляция - это степень, в которой события или личные характеристики человека зависят друг от друга. Корреляционный метод - процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?

Корреляция - степень зависимости друг от друга событий или характеристик.

Корреляционный метод - процедура исследований, которая используется для определения того, насколько события или характеристики зависят друг от друга.

Чтобы ответить на этот вопрос, исследователи подсчитывают баллы жизненного стресса (например, количество угрожающих событий, переживаемых человеком в определенный период времени) и баллы депрессии (например, баллы в опросниках по депрессии). Как правило, исследователи обнаруживают, что эти переменные увеличиваются или уменьшаются вместе (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To есть чем больше количество баллов стресса в жизни определенного человека, тем выше его или ее сумма баллов по депрессии. Корреляции такого рода имеют позитивную направленность и их называют позитивной корреляцией.

Корреляция может иметь и негативную, а не позитивную направленность. При негативной корреляции, когда значение одной переменной возрастает, значение другой уменьшается. Исследователи обнаружили, например, негативную корреляцию между депрессией и уровнем активности. Чем больше депрессия человека, тем меньше его занятость.

Существует еще и третья взаимосвязь в корреляционном исследовании. Две переменные могут быть не взаимосвязаны, то есть между ними не существует последовательной взаимосвязи. Когда число одной переменной возрастает, показатели другой переменной иногда возрастают, иногда уменьшаются. Исследования обнаружили, например, что депрессия и интеллект не зависят друг от друга.

Кроме знания направленности корреляции исследователям нужно знать ее величину или силу. То есть насколько близко эти две переменные соотносятся между собой. Действительно ли одна переменная всегда зависит от другой или их взаимосвязь менее определенна? Когда обнаруживается тесная взаимосвязь двух переменных у многих испытуемых, то говорят, что корреляция - высокая или устойчивая.

Направленность и величина корреляции часто имеет численное значение и выражается в статистическом понятии - коэффициенте корреляции ( r ). Коэффициент корреляции может варьироваться от +1.00, показывающего полную позитивную корреляцию между двумя переменными, и до -1.00 - этот коэффициент указывает на полную негативную корреляцию. Знак коэффициента (+ или -) обозначает направленность корреляции; число представляет ее величину. Чем ближе коэффициент к 0, тем слабее корреляция и меньше ее величина. Так корреляции +0.75 и -0.75 имеют одинаковые величины, а корреляция +.25 слабее и той и другой корреляции.

Коэффициент корреляции ( r ) - статистический термин, указывающий направленность и величину корреляции, колеблющийся от -1.00 до +1.00.

Поведение людей меняется, и многие человеческие реакции можно оценивать лишь приблизительно. Поэтому в психологических исследованиях корреляции не достигают величины полной позитивной или полной негативной корреляции. В одном исследовании стресса и депрессии, проводившемся с 68 взрослыми, корреляция между двумя переменными составила +0.53 (Miller et al., 1976). Несмотря на то, что эту корреляцию едва ли можно назвать абсолютной, ее величина в психологическом исследовании считается большой.

Статистический анализ корреляционных данных

Ученые должны решить, действительно ли корреляция, обнаруженная ими в данной группе испытуемых, точно отражает подлинную корреляцию в общем населении. Может ли наблюдаемая корреляция возникать только случайно? Ученые могут протестировать свои выводы при помощи статистического анализа данных, применив принципы вероятности. В сущности, они задаются вопросом, насколько вероятно, что данные отдельного исследования были получены случайно. Если статистический анализ указывает на очень малую вероятность того, что обнаруженная корреляция была получена случайно, то исследователи называют корреляцию статистически значимой и делают вывод, что их данные отражают подлинную корреляцию, встречающуюся повсеместно.

Преимущества и недостатки корреляционного метода

У корреляционного метода есть некоторые преимущества по сравнению с изучением отдельных случаев болезни. Поскольку исследователи получают свои переменные, основываясь на многочисленных примерах, и применяют статистический анализ, то они лучше могут обобщить данные о людях, которых изучали. Исследователи также могут повторить корреляционные исследования на новых испытуемых, чтобы проверить результаты своих изысканий.

Несмотря на то, что корреляционные исследования позволяют исследователям описать взаимосвязь между двумя переменными, они не объясняют эту взаимосвязь. Когда мы взглянем на позитивную корреляцию, обнаруживающуюся при исследовании разных жизненных стрессов, у нас может возникнуть искушение сделать вывод, что усиление стресса приводит к более сильной депрессии. На самом деле, однако, эти две переменные могли коррелировать по одной из трех причин: 1) жизненный стресс может приводить к депрессии; 2) депрессия может заставить людей перенести более сильный стресс (например, депрессивный подход к жизни приводит к тому, что люди будут неправильно распоряжаться деньгами или депрессия негативно скажется на их социальных взаимоотношениях); 3) депрессия и жизненный стресс могут быть обусловлены третьей переменной, такой как бедность. Вопросы причинности требуют применения экспериментального метода.

<Вопросы для размышления. Как бы вы объяснили значительную корреляцию между жизненным стрессом и депрессией? Какая из интерпретаций, по вашему мнению, наиболее точна?>

Особые формы корреляционного исследования

Клиницисты широко используют два типа корреляционных исследований - эпидемиологические исследования и долгосрочные (лонгитюдные) исследования. В ходе эпидемиологических исследований обнаруживается общее число случаев и распространенность определенного расстройства среди указанной части населения (Weissman, 1995). Число случаев - это количество новых случаев расстройств, возникших за данный период времени. Распространенность - общее число случаев среди населения в данный период времени; распространенность расстройства или заболевания включает как уже существующие, так и новые случаи.

За прошедшие двадцать лет клиницисты в США разработали самое обширное эпидемиологическое исследование, которое когда-либо проводилось, и назвали его Районным эпидемиологическим исследованием. Они взяли интервью более чем у 20 000 людей в пяти городах, чтобы выяснить преобладание разных психических расстройств и то, какие программы применялись для их лечения (Regier et al., 1993). Это исследование сравнивалось в эпидемиологическими исследованиями в других странах, чтобы проверить, как уровни психических расстройств и программы лечения варьируются в разных странах мира (Weissman, 1995).

<Близнецы, корреляция и наследственность. Корреляционные исследования многих пар близнецов позволяют сделать вывод о возможной взаимосвязи между генетическими факторами и некоторыми психическими расстройствами. Идентичные близнецы (близнецы, которые, как и изображенные здесь, обладают идентичными генами) проявляют высокую степень корреляции при некоторых расстройствах, и эта корреляция выше, чем у неидентичных близнецов (с неидентичными генами).>

Такие эпидемиологические исследования помогают психологам выделить группы риска, предрасположенные к определенным расстройствам. Оказывается, что среди женщин превалирует уровень расстройств, связанных с тревожным состоянием и депрессией, в отличие от мужчин, среди которых преобладает более высокий уровень алкоголизма, чем у женщин. У пожилых людей уровень суицида выше, чем у людей помоложе. У людей в некоторых не западных странах (например, в Тайване) уровень психической дисфункции выше, чем на Западе. Эти тенденции приводят исследователей к предположению, что какие-то особые факторы и среда провоцируют определенные типы расстройств (Rogers & Holloway, 1990). Так, ухудшение здоровья у пожилых людей с большей вероятностью приводит их к самоубийству; культурные прессы или установки, распространенные в одной стране, приводят к определенному уровню психических дисфункций, отличающемуся от уровня тех же дисфункций в другой стране.

Эпидемиологическое исследование - исследование, которое определяет число случаев заболевания и его распространенность среди данного слоя населения.

Число случаев заболевания - количество новых случаев расстройства, возникающих в данном слое населения в определенный период времени.

Распространенность - общее число случаев расстройств, возникающих в данном слое населения за определенный период времени.

Проводя долгосрочные исследования, психологи наблюдают тех же самых испытуемых в разных ситуациях на протяжении длительного периода времени. В одном таком опыте ученые наблюдали в течение многих лет развитие нормально функционирующих детей, чьи отец или мать страдали от шизофрении (Parnas, 1988; Mednick, 1971). Исследователи обнаружили среди прочего, что дети родителей с тяжелыми формами шизофрении чаще обнаруживали психические отклонения и совершали преступления на поздних стадиях своего развития.

Долгосрочное (лонгитюдное) исследование - исследование, в котором те же самые испытуемые наблюдаются в течение длительного периода времени.

Поделиться