Съотношения в дипломните работи по психология.

корелационен метод.

За да преодолеят ограниченията на метода на казуса, изследователите на личността често използват алтернативна стратегия, известна като корелационен метод.Този метод се стреми да установи връзки между и в рамките на събития (променливи). Променлива - всяка величина, която може да бъде измерена и чието количествено изразяване може да варира в рамките на даден континуум. Например, тревожността е променлива, защото може да бъде измерена (с помощта на скалата за самооценка на тревожността) и защото хората се различават по степента си на тревожност. По същия начин, точността на изпълнение на задача, която изисква определено умение, също е променлива, която може да бъде измерена. Корелационно изследване може да се направи просто чрез измерване на нивото на тревожност при определен брой хора, както и нивото на точност на действията на всеки от тях, когато групата изпълнява сложна задача. Ако публикуваните резултати се потвърдят в друго проучване, тогава субектите с по-ниски резултати за тревожност може да се считат за по-високи резултати по отношение на точността на задачата. Тъй като други фактори (например предишен опит със задачата, мотивация, интелигентност) вероятно ще повлияят на точността на задачата, връзката между точността на задачата и тревожността няма да бъде перфектна, но ще бъде достойна за внимание.

Променливите в корелационното изследване могат да бъдат данни от тестове, демографски характеристики (като възраст, ред на раждане и социално-икономически статус), мерки за самооценени личностни черти, мотиви, ценности и нагласи и физиологични реакции (като сърдечен ритъм, артериално наляганеи галванична реакция на кожата), както и стилове на поведение. Използвайки корелационен методпсихолозите искат отговори на конкретни въпроси като дали висше образованиеза професионален успех в бъдеще? Свързан ли е стресът с коронарна болест на сърцето? Има ли връзка между самочувствието и самотата? Има ли връзка между реда на раждане и мотивацията за постижения? Методът на корелация не само ви позволява да отговорите с "да" или "не" на тези въпроси, но и дава количествено определянесъпоставяне на стойностите на една променлива със стойностите на друга променлива. За да решат този проблем, психолозите изчисляват статистически индекс, наречен коефициент на корелация(известен също като коефициент на линейна корелация на Пиърсън). Коефициент на корелация (означен с малка буква r) ни показва две неща: 1) степента на зависимост на две променливи и 2) посоката на тази зависимост (пряка или обратна връзка).

Числовата стойност на коефициента на корелация варира от -1 (напълно отрицателна или обратна връзка) през 0 (без връзка) до +1 (напълно положителна или пряка връзка). Коефициент близо до нула означава, че двете измерени променливи не са свързани по никакъв забележим начин. Тоест големи или малки стойности на променливата хнямат значителна връзка с големи или малки стойности на променливата Й. Като пример, разгледайте връзката между две променливи: телесно тегло и интелигентност. Като цяло хората с наднормено тегло не са значително по-интелигентни или значително по-малко интелигентни от по-слабите хора. Обратно, коефициент на корелация от +1 или -1 показва пълно, едно към едно съответствие между две променливи. В изследванията на личността почти никога не се откриват корелации, близки до перфектни, което предполага, че въпреки че много психологически променливи са свързани помежду си, степента на връзка между тях не е толкова силна. Стойността на коефициента на корелация в диапазона между ±0,30 и ±0,60 е често срещана в изследванията на личността и има практическа и теоретична стойност за научното прогнозиране. Стойностите на коефициента на корелация между 0 и ±0,30 трябва да се третират с повишено внимание - тяхната стойност за научни прогнози е минимална. На фиг. 2-2 са графики на разпределението на стойностите на две променливи за две различни стойностикоефициент на корелация. Хоризонтално са стойностите на една променлива, а вертикално са стойностите на другата. Всяка точка означава резултатите, получени от един субект за две променливи.

Ориз. 2-2.Всяка диаграма илюстрира различни степенизависимост на стойностите на две променливи. Всяка точка на диаграмата представлява представянето на субекта в две променливи: а - обща положителна корелация (r = +1); b - пълна отрицателна корелация (r = -1); c - умерена положителна корелация (r = +0,71); d - няма корелация (r = 0).

положителна корелацияозначава, че големите стойности на една променлива са склонни да бъдат свързани с големи стойности на друга променлива, или малките стойности на една променлива са склонни да бъдат свързани с малки стойности на друга променлива. С други думи, две променливи се увеличават или намаляват заедно. Например, има положителна корелация между височината и телесното тегло на хората. Като цяло, повече високи хораима тенденция към по-голямо телесно тегло от по-ниските. Друг пример за положителна корелация е връзката между броя сцени на насилие, които децата виждат по телевизията, и тяхната склонност да действат агресивно. Средно, колкото по-често децата гледат насилие по телевизията, толкова по-често проявяват агресивно поведение. отрицателна корелацияозначава, че високите стойности на една променлива са свързани с ниски стойности на друга променлива и обратно.

Пример за отрицателна корелация е връзката между честотата на отсъствие на студенти в класната стая и успеха им при полагане на изпити. Като цяло учениците, които са имали повече пропуснати часове, имат по-ниски резултати на изпитите. Студентите с по-малко успехи получиха по-високи резултати от изпитите. Друг пример е отрицателната връзка между срамежливостта и асертивното поведение. Индивидите, които са постигнали висок резултат от индекса на срамежливост, са склонни да бъдат нерешителни, докато тези с ниски резултати за срамежливост са решителни и категорични. Колкото по-близо е стойността на коефициента на корелация до +1 или до -1, толкова по-силна е връзката между двете изследвани променливи. По този начин, коефициент на корелация от +0,80 отразява наличието на по-силна връзка между две променливи, отколкото коефициент на корелация от +0,30. По същия начин, коефициент на корелация от -0,65 отразява по-силна корелация на променливите от коефициент на корелация от -0,25. Трябва да се има предвид, че стойността на корелацията зависи само от числовата стойност на коефициента, докато знакът “+” или “-” пред коефициента просто показва дали тази корелация е положителна или отрицателна. По този начин стойността r = +0,70 отразява наличието на същата силна зависимост като стойността r = -0,70. Но първият пример показва положителна зависимост, а вторият - отрицателна. Освен това, коефициент на корелация от -0,55 показва по-силна връзка от коефициент на корелация от +0,35. Разбирането на тези аспекти на статистиката на корелацията ще ви помогне да оцените резултатите от този вид изследване.

За да преодолеят ограниченията на метода на казуса, изследователите на личността често използват алтернативна стратегия, известна като корелационен метод. Този метод се стреми да установи връзки между и в рамките на събития (променливи). Променлива - всяка величина, която може да бъде измерена и чието количествено изразяване може да варира в рамките на даден континуум. Например, тревожността е променлива, защото може да бъде измерена (с помощта на скалата за самооценка на тревожността) и защото хората се различават по степента си на тревожност. По същия начин, точността на изпълнение на задача, която изисква определено умение, също е променлива, която може да бъде измерена. Корелационно изследване може да се направи просто чрез измерване на нивото на тревожност при определен брой хора, както и нивото на точност на действията на всеки от тях, когато групата изпълнява сложна задача. Ако публикуваните резултати се потвърдят в друго проучване, тогава субектите с по-ниски резултати за тревожност може да се считат за по-високи резултати по отношение на точността на задачата. Тъй като други фактори (например предишен опит със задачата, мотивация, интелигентност) вероятно ще повлияят на точността на задачата, връзката между точността на задачата и тревожността няма да бъде перфектна, но ще бъде достойна за внимание.

Променливите в корелационното проучване могат да бъдат данни от тестове, демографски характеристики (като възраст, ред на раждане и социално-икономически статус), мерки за самооценени черти, мотивации, ценности и нагласи и физиологични реакции (като сърдечен ритъм, кръвно налягане ). и галванична реакция на кожата), както и стилове на поведение. Когато използват корелационния метод, психолозите искат да получат отговори на такива специфични въпроси като: Влияе ли висшето образование на професионалния успех в бъдеще? Свързан ли е стресът с коронарна болест на сърцето? Има ли връзка между самочувствието и самотата? Има ли връзка между реда на раждане и мотивацията за постижения? Методът на корелация не само ви позволява да отговорите с "да" или "не" на тези въпроси, но и да определите количествено съответствието между стойностите на една променлива и стойностите на друга променлива. За да решат този проблем, психолозите изчисляват статистически индекс, наречен коефициент на корелация(известен също като коефициент на линейна корелация на Пиърсън). Коефициент на корелация (означен с малка буква r) ни показва две неща: 1) степента на зависимост на две променливи и 2) посоката на тази зависимост (пряка или обратна връзка).

Числовата стойност на коефициента на корелация варира от -1 (напълно отрицателна или обратна връзка) през 0 (без връзка) до +1 (напълно положителна или пряка връзка). Коефициент близо до нула означава, че двете измерени променливи не са свързани по никакъв забележим начин. Тоест големи или малки стойности на променливата хнямат значителна връзка с големи или малки стойности на променливата Й. Като пример, разгледайте връзката между две променливи: телесно тегло и интелигентност. Като цяло хората с наднормено тегло не са значително по-интелигентни или значително по-малко интелигентни от по-слабите хора. Обратно, коефициент на корелация от +1 или -1 показва пълно, едно към едно съответствие между две променливи. В изследванията на личността почти никога не се откриват близки до перфектни корелации, което предполага, че въпреки че много променливи са свързани помежду си, степента на връзка между тях не е толкова силна. Стойността на коефициента на корелация в диапазона между ±0,30 и ±0,60 е често срещана в изследванията на личността и има практическа и теоретична стойност за научното прогнозиране. Стойностите на коефициента на корелация между 0 и ±0,30 трябва да се третират с повишено внимание - тяхната стойност за научни прогнози е минимална. На фиг. 2-2 са графики на разпределението на стойностите на две променливи за две различни стойности на коефициента на корелация. Хоризонтално са стойностите на една променлива, а вертикално са стойностите на другата. Всяка точка означава резултатите, получени от един субект за две променливи.

Ориз. 2-2.Всяка от диаграмите илюстрира различна степен на зависимост на стойностите на две променливи. Всяка точка на диаграмата представлява представянето на субекта в две променливи: а - обща положителна корелация (r = +1); b - пълна отрицателна корелация (r = -1); c - умерена положителна корелация (r = +0,71); d - няма корелация (r = 0).

положителна корелацияозначава, че големите стойности на една променлива са склонни да бъдат свързани с големи стойности на друга променлива, или малките стойности на една променлива са склонни да бъдат свързани с малки стойности на друга променлива. С други думи, две променливи се увеличават или намаляват заедно. Например, има положителна корелация между височината и телесното тегло на хората. Като цяло, по-високите хора са склонни да имат повече телесна маса от по-ниските хора. Друг пример за положителна корелация е връзката между броя сцени на насилие, които децата виждат по телевизията, и тяхната склонност да действат агресивно. Средно, колкото по-често децата гледат насилие по телевизията, толкова по-често проявяват агресивно поведение. отрицателна корелацияозначава, че високите стойности на една променлива са свързани с ниски стойности на друга променлива и обратно.

Пример за отрицателна корелация е връзката между честотата на отсъствие на студенти в класната стая и успеха им при полагане на изпити. Като цяло учениците, които са имали повече пропуснати часове, имат по-ниски резултати на изпитите. Студентите с по-малко успехи получиха по-високи резултати от изпитите. Друг пример е отрицателната връзка между срамежливостта и асертивното поведение. Индивидите, които са постигнали висок резултат от индекса на срамежливост, са склонни да бъдат нерешителни, докато тези с ниски резултати за срамежливост са решителни и категорични. Колкото по-близо е стойността на коефициента на корелация до +1 или до -1, толкова по-силна е връзката между двете изследвани променливи. По този начин, коефициент на корелация от +0,80 отразява наличието на по-силна връзка между две променливи, отколкото коефициент на корелация от +0,30. По същия начин, коефициент на корелация от -0,65 отразява по-силна корелация на променливите от коефициент на корелация от -0,25. Трябва да се има предвид, че стойността на корелацията зависи само от числовата стойност на коефициента, докато знакът "+" или "-" пред коефициента просто показва дали тази корелация е положителна или отрицателна. По този начин стойността r = +0,70 отразява наличието на същата силна зависимост като стойността r = -0,70. Но първият пример показва положителна зависимост, а вторият - отрицателна. Освен това, коефициент на корелация от -0,55 показва по-силна връзка от коефициент на корелация от +0,35. Разбирането на тези аспекти на статистиката на корелацията ще ви помогне да оцените резултатите от този вид изследване.

Оценка на корелационния метод.

Методът на корелация има някои уникални предимства. Най-важното е, че позволява на изследователите да изследват голям набор от променливи, които не могат да бъдат тествани с експериментални изследвания. Например, когато става въпрос за установяване на връзка между сексуалното насилие в детството и емоционалните проблеми по-късно в живота, корелационният анализ може да бъде единственият етично приемлив метод за изследване. По същия начин, за да проучим как демократичните и авторитарни стилове на родителство са свързани с ценностните ориентации на човека, този метод си струва да изберете, тъй като етичните съображения правят невъзможно експерименталното контролиране на стила на родителство.

Второто предимство на метода на корелация е, че дава възможност да се изследват много аспекти на личността в естествени условия. реален живот. Например, ако искаме да оценим влиянието на родителския развод върху приспособяването и поведението на децата в училище, трябва систематично да наблюдаваме социалния и академичен напредък на децата от разбити семейства през определен период от време. Извършването на такова естествено наблюдение ще отнеме време и усилия, но ще позволи много реалистична оценка на сложното поведение. Поради тази причина методът на корелация е предпочитаната изследователска стратегия за персонолозите, които се интересуват от изучаване индивидуални различияи явления, подлежащи на експериментален контрол. Третото предимство на метода на корелация е, че понякога дава възможност да се предвиди събитие от знанието на друг. Например, едно проучване установи умерено висока положителна корелация между резултатите от SAT 4 на учениците от гимназията и техните по-късни оценки в колежа (Hargadon, 1981). Следователно, знаейки резултатите от SAT на учениците, комисия за подборв колежа могат доста точно да предскажат последващото им академично представяне. Подобни прогнози никога не са перфектни, но често са полезни при вземането на решение за прием. образователна институция. Всички изследователи на личността обаче признават два сериозни недостатъка на тази стратегия. Първо, използването на корелационния метод не позволява на изследователите да идентифицират причинно-следствени връзки. Същността на проблема е това корелационно проучване не може да даде окончателно заключение, че две променливи са причинно свързани. Например, много корелационни проучвания потвърждават връзка между насилственото гледане на телевизия и агресивното поведение при някои деца и възрастни зрители (Freedman, 1988; Huston and Wright, 1982). Какъв извод може да се направи от тези произведения? Един от възможните изводи е, че дългото гледане на насилие по телевизията води до засилване на агресивните импулси на зрителя. Но е възможно и обратното заключение: агресивни по своята същност субекти или тези, които са извършили агресивни действия, предпочитат да гледат телевизионни програми със сцени на насилие. За съжаление, корелационният метод не ни позволява да установим кое от тези две обяснения е правилно. В същото време корелационните изследвания, които установяват силна корелация между стойностите на две променливи, повдигат въпроса за възможността за причинно-следствена връзка между тези променливи. По отношение, например, на връзката между гледането на насилие по телевизията и агресията, пилотно проучване, проведено след констатациите корелационен анализ, кара учените да стигнат до заключението, че излагането на програми за насилие може да бъде причина за насилствено поведение (Eron, 1987).

4 Scholastic Attitude Test – програма за оценка на способностите за учене. Виж Анастаси А. Психологическо тестване / Изд. К. М. Гуревич, В. И. Любовски. М., 1982. - Кн. 2. - С. 48. (Прибл. научно изд.)

Вторият недостатък на корелационния метод е възможното объркване, причинено от действието на третата променлива. За да илюстрираме, помислете за връзката между употребата на наркотици от подрастващите и техните родители. Означава ли наличието на корелация, че тийнейджърите, виждайки как родителите им приемат наркотици, сами започват да ги употребяват в още по-големи количества? Или това означава, че безпокойството при вида на техните деца тийнейджъри, които приемат наркотици, кара самите родители да прибягват до наркотици, за да намалят тревожността си? Или някой трети фактор по подобен начин тласка тийнейджъри и възрастни към употреба на наркотици? Може би тийнейджърите и техните родители приемат наркотици, за да се справят с потискащата бедност, в която живеят? Тоест, истинската причина за наркоманията може да бъде социално-икономическият статус на семействата (например бедността). Възможността трета променлива, която не се измерва и за която може дори да не се подозира, действително има причинно-следствен ефект върху двете измерени променливи не може да се изключи при интерпретиране на резултатите, получени чрез корелационния метод.

Въпреки че корелационният метод не предполага установяване на причинно-следствена връзка, от това не следва, че причинно-следствените връзки в определени случаи не могат да бъдат ясно установени. Последното е особено вярно за изследванията на надлъжната корелация - където например променливите от интерес, измерени по едно и също време, корелират с други променливи, за които е известно, че се появяват след първите. Помислете например за добре известната положителна корелация между тютюнопушенето и рака на белия дроб. Въпреки възможността някоя трета неизвестна променлива (като генетично предразположение) да е причина както за тютюнопушенето, така и за рака на белия дроб, няма съмнение, че тютюнопушенето е много вероятна причина за рак, тъй като тютюнопушенето предхожда рака на белия дроб във времето. Тази стратегия (измерваща две променливи, разделени от определен период от време) позволява на изследователите да установят причинно-следствени връзки в случаите, когато е невъзможно да се проведе експеримент. Например, въз основа на клинични наблюдения, изследователите отдавна подозират, че хроничният стрес допринася за развитието на много физиологични проблеми. Последната работа по измерване на силата на стреса (с помощта на скали за самооценка) позволи тези предположения да бъдат тествани с помощта на корелационен метод. В областта на физиологичните разстройства, например, натрупването на доказателства предполага, че стресът е значително свързан с появата и развитието на сърдечно-съдови заболявания, диабет, рак и различни видове инфекциозни заболявания (Elliott and Eisdorfer, 1982; Friedman and Booth-Kelley, 1987; Джемът, Лок 1984; Смит и Андерсън 1986; Уилямс и Дефенбахер 1983). Анализът на корелацията показва също, че стресът може да допринесе за зависимостта от наркотици (Newcomb and Harlow, 1986), сексуална дисфункция (Malatesta and Adams, 1984) и множество психиатрични разстройства (Neufeld and Mothersill, 1980). Критиците на корелационния подход обаче правилно посочват, че може да има и други фактори, които изкуствено подсилват предполагаемата връзка между стреса и болестта (Schroeder and Costa, 1984). По този начин остава едно предупреждение: въпреки че понякога, когато има силна корелация между две променливи, може да се заключи, че има причинно-следствена връзка между тях, в действителност причинно-следствената връзка може да бъде установена само чрез експериментални методи.

V научно изследванечесто има нужда да се намери връзка между резултантните и факторните променливи (добивът на реколтата и количеството на валежите, височината и теглото на човек в хомогенни групи по пол и възраст, честота на пулса и телесна температура и др. ).

Вторите са знаци, които допринасят за промяната на свързаните с тях (първите).

Концепцията за корелационен анализ

Има набор Въз основа на горното можем да кажем, че корелационният анализ е метод, използван за тестване на хипотезата за статистическата значимост на две или повече променливи, ако изследователят може да ги измери, но не и да ги промени.

Има и други дефиниции на разглежданото понятие. Корелационният анализ е метод за обработка, който изследва коефициентите на корелация между променливите. В този случай коефициентите на корелация между една двойка или множество двойки характеристики се сравняват, за да се установят статистически връзки между тях. Корелационният анализ е метод за изследване на статистическата зависимост между случайни величини с незадължително наличие на строго функционален характер, при който динамиката на една случайна величина води до динамиката на математическото очакване на друга.

Концепцията за фалшива корелация

При провеждане на корелационен анализ трябва да се има предвид, че той може да се извърши по отношение на всяка съвкупност от характеристики, често абсурдни по отношение един на друг. Понякога те нямат причинно-следствена връзка един с друг.

В този случай се говори за фалшива корелация.

Проблеми на корелационния анализ

Въз основа на горните дефиниции можем да формулираме следните задачи на описания метод: получаване на информация за една от желаните променливи с помощта на другата; определят близостта на връзката между изследваните променливи.

Корелационният анализ включва определяне на връзката между изследваните характеристики и следователно задачите на корелационния анализ могат да бъдат допълнени със следното:

  • идентифициране на фактори, които оказват най-голямо влияние върху резултантния знак;
  • идентифициране на неизследвани преди това причини за взаимоотношения;
  • изграждане на корелационен модел с неговия параметричен анализ;
  • изследване на значимостта на комуникационните параметри и тяхната интервална оценка.

Връзка на корелационния анализ с регресията

Методът на корелационния анализ често не се ограничава до намиране на близостта на връзката между изследваните величини. Понякога се допълва от съставянето на регресионни уравнения, които се получават с помощта на едноименния анализ и които са описание на корелацията между резултантния и факторния (факториален) атрибут(и). Този метод, заедно с разглеждания анализ, съставлява метода

Условия за използване на метода

Факторите на резултата зависят от един или повече фактори. Методът на корелационния анализ може да се приложи, ако има голям бройнаблюдения върху стойността на ефективни и факторни показатели (фактори), докато изследваните фактори трябва да бъдат количествени и отразени в конкретни източници. Първият може да се определи по нормалния закон - в този случай коефициентите на корелация на Пиърсън са резултат от корелационния анализ или, ако знаците не се подчиняват на този закон, се използва коефициентът на корелация на ранг на Спирман.

Правила за избор на фактори за корелационен анализ

При прилагането на този метод е необходимо да се определят факторите, които влияят върху показателите за изпълнение. Те са избрани, като се вземе предвид фактът, че трябва да има причинно-следствени връзки между показателите. В случай на създаване на многофакторен корелационен модел се избират тези, които оказват значително влияние върху резултантния показател, докато взаимозависимите фактори с двоен коефициент на корелация над 0,85 за предпочитане не трябва да се включват в корелационния модел, както и тези в която връзката с резултантния параметър е косвена.или функционална.

Показване на резултатите

Резултатите от корелационния анализ могат да бъдат представени в текстова и графична форма. В първия случай те се представят като коефициент на корелация, във втория като диаграма на разсейване.

При липса на корелация между параметрите точките на диаграмата са разположени хаотично, средната степен на свързаност се характеризира с по-голяма степен на подреденост и се характеризира с повече или по-малко равномерно разстояние на маркираните знаци от медианата. Силната връзка клони към права линия и при r=1 диаграмата на разсейване е плоска линия. Обратната корелация се характеризира с посоката на графиката от горния ляв към долен десен, а директната - от долния ляв към горния десен ъгъл.

3D представяне на диаграма на разсейване (разсейване)

В допълнение към традиционното представяне на 2D диаграма на разсейване, в момента се използва 3D графично представяне на корелационния анализ.

Използва се и матрица на диаграма на разсейване, която показва всички сдвоени графики в една фигура в матричен формат. За n променливи матрицата съдържа n реда и n колони. Диаграмата, разположена в пресечната точка на i-тия ред и j-тата колона, е графика на променливите Xi в сравнение с Xj. По този начин всеки ред и колона е едно измерение, една клетка показва диаграма на разсейване на двете измерения.

Оценка на херметичността на връзката

Стегнатостта на корелацията се определя от коефициента на корелация (r): силна - r = ±0,7 до ±1, средна - r = ±0,3 до ±0,699, слаба - r = 0 до ±0,299. Тази класификацияне е строг. Фигурата показва малко по-различна схема.

Пример за прилагане на метода за корелационен анализ

Интересно проучване беше направено във Великобритания. Той е посветен на връзката между тютюнопушенето и рака на белия дроб и е извършен чрез корелационен анализ. Това наблюдение е представено по-долу.

Изходни данни за корелационен анализ

Професионална група

смъртност

Фермери, горски и рибари

Миньори и кариери

Производители на газ, кокс и химикали

Производители на стъкло и керамика

Работници в пещи, ковачници, леярни и валцови мелници

Работници по електротехника и електроника

Инженерни и сродни професии

Дървообработващо производство

Кожари

Текстилни работници

Производители на работно облекло

Работници в хранително-вкусовата промишленост, производството на напитки и тютюна

Производители на хартия и печат

Производители на други продукти

Строители

Художници и декоратори

Шофьори на стационарни двигатели, кранове и др.

Работници, които не са включени другаде

Транспортни и комуникационни работници

Работници в складове, склададжии, опаковчици и работници в машини за пълнене

офис работници

Продавачи

Спортни и развлекателни служители

Администратори и мениджъри

Професионалисти, техници и художници

Започваме корелационния анализ. По-добре е да започнете решението за по-голяма яснота с графичен метод, за който ще изградим диаграма на разсейване (разпръскване).

Тя показва пряка връзка. Трудно е обаче да се направи еднозначен извод само на базата на графичния метод. Затова ще продължим да извършваме корелационен анализ. По-долу е показан пример за изчисляване на коефициента на корелация.

С помощта на софтуерни инструменти (на примера на MS Excel ще бъде описан по-долу) определяме коефициента на корелация, който е 0,716, което означава силна връзка между изследваните параметри. Нека определим статистическата значимост на получената стойност според съответната таблица, за която трябва да извадим 2 от 25 двойки стойности, в резултат получаваме 23 и за този ред в таблицата намираме r критичен за p = 0,01 ( тъй като това са медицински данни, по-строга зависимост, в други случаи е достатъчна p=0,05), което е 0,51 за този корелационен анализ. Примерът демонстрира, че изчисленото r е по-голямо от критичното r, стойността на коефициента на корелация се счита за статистически значима.

Използване на софтуер в корелационния анализ

Описаният тип обработка на статистически данни може да се извърши с помощта на софтуер, по-специално MS Excel. Корелацията включва изчисляване на следните параметри с помощта на функции:

1. Коефициентът на корелация се определя с помощта на функцията CORREL (масив1; масив2). Масив1,2 е клетка от диапазона от стойности на резултантните и факторни променливи.

Коефициентът на линейна корелация се нарича още коефициент на корелация на Пиърсън и следователно, като се започне с Excel 2007, можете да използвате функцията със същите масиви.

Графичното показване на корелационния анализ в Excel се извършва с помощта на панела "Диаграми" с избор "Разсейване".

След като посочим изходните данни, получаваме графика.

2. Оценка на значимостта на коефициента на корелация на двойките с помощта на t-теста на Студент. Изчислената стойност на t-критерия се сравнява с табличната (критична) стойност на този индикатор от съответната таблица със стойности на разглеждания параметър, като се вземе предвид даденото ниво на значимост и броя на степените на свобода. Тази оценка се прави с помощта на функцията STUDIV(вероятност; степени_на_свобода).

3. Матрица на двойните корелационни коефициенти. Анализът се извършва с помощта на инструмента "Анализ на данни", в който се избира "Корелация". Статистическата оценка на двойните корелационни коефициенти се извършва чрез сравняване на абсолютната им стойност с табличната (критична) стойност. Когато изчисленият коефициент на корелация на двойката надвиши този критичния, можем да кажем, като вземем предвид дадената степен на вероятност, че нулевата хипотеза за значимостта на линейната връзка не се отхвърля.

Най-накрая

Използването на метода на корелационния анализ в научните изследвания дава възможност да се определи връзката между различни фактори и показатели за ефективност. В същото време трябва да се има предвид, че висок коефициент на корелация може да се получи и от абсурдна двойка или набор от данни и следователно този тип анализ трябва да се извърши върху достатъчно голям масив от данни.

След получаване на изчислената стойност на r е желателно тя да се сравни с r критично, за да се потвърди статистическата значимост на определена стойност. Анализът на корелацията може да се извърши ръчно с помощта на формули или с помощта на софтуерни инструменти, по-специално MS Excel. Тук можете също да изградите диаграма на разсейване (scatter) с цел визуално представяне на връзката между изследваните фактори на корелационния анализ и получената характеристика.

При провеждане на изследвания в областта на биологията или медицината, като правило, се записват много счетоводни характеристики. Интерес представлява въпросът за тяхното взаимно изменение, т.е. откриване на зависимости между тях. Разкриването на наличието на такива взаимоотношения е една от най-важните задачи на всяка наука, включително и на медицината.

Има две форми на количествени връзки между явления или процеси: функционалност и корелация. Под ФУНКЦИОНАЛЕНразбират такава връзка, при която всяка стойност на един от знаците съответства на строго определена стойност на другия. В точните науки, като физика, химия и други, може да се установи функционална връзка. Например, зависимостта на площта на кръг от обиколката в геометрията или във физиката, дължината на пътя, изминат от тялото при свободно падане, от времето. Повечето известна гледкафункционалната зависимост е линейна, което се изразява с математическата формула: y=ax+b .

В биологията и медицината по правило не е възможно да се установи функционална зависимост. Обектите на тези изследвания са силно променливи и зависят от огромен брой фактори, които е просто невъзможно да бъдат измерени. В този случай се определя наличието КОРЕЛАЦИЯвръзка, при която стойността на всяка средна стойност на един атрибут съответства на няколко стойности на друг атрибут, свързан помежду си с него. Например: връзката между височината и телесното тегло на човек. Група хора с еднакъв ръст има различно телесно тегло, но то варира в определени граници около средната стойност. Следователно, такава зависимост трябва да бъде оценена с помощта на концепцията за случайна променлива с участието на подходите на теорията на вероятностите. Тази форма на зависимост се нарича "корелация".

Когато се търси връзка между знаците, може да се намери връзка, която е различна по посока и сила:

Директен (с увеличаване на един знак, вторият се увеличава);

Обратно (с увеличаване на един знак, вторият намалява).

Степента на корелация на знаците по отношение на силата (стегнатост) обикновено се обозначава като:

Отсъствие;

Среден;

Силен;

Начините за идентифициране на корелационната връзка между характеристиките са:

Визуално (таблици и графики).

Статистически (корелация и регресия).

Трябва да се подчертае, че откриването на корелация между две характеристики все още не показва наличието на причинно-следствена връзка между тях, а само показва възможността за такава връзка или наличието на фактор, който определя промяната на двете променливи заедно.

Техниките за визуализация на данни позволяват да се открие корелационна зависимост само с малък брой наблюдения и само приблизително. За откриване на корелация с помощта на таблицатой съдържа класирани серии от вариации и след това определя общата промяна в характеристиките. Графикпо-ясно демонстрира такава зависимост и ви позволява да оцените нейната форма: линейна, параболична, тригонометрична и др.



Най-точният начин за откриване на връзката между характеристиките е да се изчисли коефициент на корелация. В зависимост от естеството на обработваните данни се използват параметрични или непараметрични методи за изчисляване на този коефициент.

При изчисляване на коефициента на корелация изследователят получава възможност да прецени силата на връзката (степента на конюгиране) и нейната посока, както и да заключи с необходимата степен на вероятност за проявата на тази връзка в общата популация. Колкото по-висок е коефициентът на корелация, толкова по-уверено можем да говорим за наличието на корелация между признаците. Ако всяка дадена стойност на един атрибут съответства на близо един до друг, близо до средната стойност на стойността на друг атрибут, тогава връзката е по-близка. Когато тези стойности варират значително, връзката е по-малко силна. По този начин мярката за корелация показва колко тясно свързани са параметрите.

Коефициентът на корелация може да вземе стойности от -1 до +1.Посоката на откритата връзка се определя от знака на коефициента на корелация. Когато то положителна стойностустановената връзка е пряка, с отрицателна - обратна. Силата на връзката се оценява по модула на този коефициент. Обикновено се разграничават следните нива на корелация: отсъствие - 0; слаб - от 0 до 0,3; среден - от 0,3 до 0,7; силен - 0,7 или повече; завършен - 1.Въпреки това има смисъл да се обсъжда съществуването на корелация само в случаите, когато тя е статистически значима ( стр <0,05). Поэтому после вычисления коэффициента корреляции производится определение его ошибки репрезентативности и критерия достоверности.

Най-често използваните методи за откриване на корелации днес са параметричният анализ на Пиърсън и непараметричният анализ на Спирман. Тези методи тестват нулевата хипотеза ( H0 ) за липсата на връзка между параметрите. Ако такава хипотеза бъде отхвърлена на дадено ниво на значимост ( стр ), можем да говорим за връзката между параметрите.

Корелационният анализ по Пиърсън се използва при решаването на проблема за изследване на линейна връзка между два нормално разпределени параметъра. В допълнение към проверката за нормалността на разпределението на всеки параметър, преди провеждане на корелационен анализ, се препоръчва да се изгради графика в координатите на оценените параметри, за да се определи визуално естеството на зависимостта.

Коефициент на корелация на Пиърсън (rxy ) или коефициент на линейна корелация, е разработен през 90-те години на миналия век от Карл Пиърсън, Франсис Еджуърт и Рафаел Уелдън в Англия. Изчислява се по формулата:

където: rxy

covXY– ковариация на признаците х и Й ;

σ X х ;

σ Y– стандартно отклонение на характеристиката Y;

х ;

- средноаритметично на признака Й .

В медицинската литература има опростена версия на тази формула:

където: rxy е коефициентът на линейна корелация на Пиърсън;

d x х от средната стойност на този знак: d x = х-Мх,

г г– отклонение на всеки вариант на характеристиката г от средната стойност на този знак: г г = y-Mг.

В Excel стойността на коефициента на линейна корелация на Пиърсън може да се изчисли с помощта на функцията = CORREL(Обхват от клетки от 1-ви ред; Обхват от клетки на 2-ри ред).

За да се предвиди нивото на корелация в общата съвкупност, се определя грешката на представителността на този коефициент г-н . Изчислява се по формулата:

,

където: г-н е грешката на представителността на коефициента на корелация;

rxyе коефициентът на линейна корелация на Пиърсън;

н- броя на сдвоените опции.

Надеждността на линейния коефициент на корелация се оценява от коефициента на Студент ( r ), който се изчислява с помощта на неговата грешка:

където: r

rxyе коефициентът на линейна корелация на Пиърсън;

г-не грешката на представителността на коефициента на корелация.

Ако броят на сдвоените опции н >30, след това при r Връзката >2 се счита за значима на ниво значимост стр <0,05. Если число парных вариант н <30, то критическое значение t r-Crit. се намират според таблицата на Студент на критичните стойности със степени на свобода df = n - 2 . В Excel тази стойност се изчислява от функцията = STUDISP(Ниво на значимост стр ; Степени на свобода df ).

За да се намали количеството на изчисленията, може да се използва функцията =CORREL(Range1; Range2) или добавката „Анализ на данни“ и нейния модул „Корелационен анализ“.

Липсата на линейна корелация не означава, че параметрите са напълно независими. Връзката между тях може да е нелинейна или характеристиките, използвани в изчисленията, може да не се подчиняват на нормалния закон за разпределение. Следователно, в допълнение към изчисляването на линейния коефициент на корелация, се прибягва до използването на непараметрични корелационни коефициенти. Те включват:

Коефициент на корелация на ранга на Спирман;

Коефициент на корелация на ранг на Кендъл;

Коефициент на корелация на знаците на Фехнер;

Коефициент на множествена рангова корелация (съгласуваност).

Корелационен анализ на Спирмансе използва за откриване на връзката на два параметъра, ако разпределението на поне един от тях е различно от нормалното.

Всеки индикатор х и г присвоен е ранг. Въз основа на получените разлики се изчисляват техните разлики д. След това се изчислява коефициентът на корелация ( ρ ) по формулата:

където: r

д – разлика в ранга;

н- броя на сдвоените опции.

Грешката на представителността на коефициента на корелация на Спиърман се определя по формулата:

,

и коефициент на увереност на студента:

където: r – Коефициент на надеждност на Студент;

rе коефициентът на корелация на Спиърман;

г-не грешката на представителността на коефициента на корелация на Спиърман.

Оценката на коефициента на корелация на Спиърман и неговата надеждност се извършва по същия начин като коефициента на линейна корелация на Пиърсън.

Корелация - това е степента, до която събитията или личните характеристики на даден човек зависят един от друг. Методът на корелация е процедура в изследванията, използвана за определяне на връзката между променливите. Този метод може например да отговори на въпроса: „Има ли връзка между количеството стрес, което хората изпитват, и степента на депресия, която изпитват?“ Тоест, тъй като хората продължават да изпитват стрес, колко по-вероятно е да изпаднат в депресия?

Корелация - степента, до която събитията или характеристиките зависят едно от друго.

корелационен метод - изследователска процедура, която се използва, за да се определи как събитията или характеристиките са взаимозависими.

За да отговорят на този въпрос, изследователите изчисляват оценките за житейски стрес (напр. броят на заплашителни събития, които човек преживява за даден период от време) и оценките за депресия (напр. резултати от въпросниците за депресия). Обикновено изследователите установяват, че тези променливи се увеличават или намаляват заедно (Stader & Hokanson, 1998; Paykel & Cooper, 1992). Тоест, колкото по-висок е резултатът от стреса в живота на човек, толкова по-висок е неговият/нейният резултат за депресия. Корелациите от този вид имат положителна посока и се наричат ​​положителни корелации.

Корелацията може да бъде както отрицателна, така и положителна. При отрицателна корелация, когато стойността на една променлива се увеличава, стойността на другата намалява. Изследователите са открили, например, отрицателна връзка между депресията и нивата на активност. Колкото по-депресиран е човек, толкова по-малко е зает.

Има и трета връзка в корелационното изследване. Две променливи може да не са свързани, тоест няма последователна връзка между тях. Когато броят на една променлива се увеличи, производителността на другата променлива понякога се увеличава, понякога намалява. Изследванията показват, например, че депресията и интелигентността са независими една от друга.

В допълнение към познаването на посоката на корелацията, изследователите трябва да знаят нейната величина или сила. Тоест колко тясно са свързани тези две променливи една с друга. Винаги ли една променлива зависи от другата или връзката им е по-малко сигурна? Когато се установи тясна връзка между две променливи при много субекти, се казва, че корелацията е висока или стабилна.

Посоката и големината на корелацията често имат числова стойност и се изразяват в статистическа концепция - коефициент на корелация ( r ). Коефициентът на корелация може да варира от +1,00, което показва пълна положителна корелация между двете променливи, до -1,00, което показва пълна отрицателна корелация. Знакът на коефициента (+ или -) показва посоката на корелацията; числото представлява неговата величина. Колкото по-близо е коефициентът до 0, толкова по-слаба е корелацията и толкова по-малка е нейната величина. Така че корелациите +0.75 и -0.75 имат еднакви стойности, а корелацията +.25 е по-слаба от двете корелации.

Коефициент на корелация ( r ) - статистически термин, указващ посоката и големината на корелацията, вариращ от -1,00 до +1,00.

Поведението на хората се променя и много човешки реакции могат да бъдат само приблизителни. Следователно в психологическите изследвания корелациите не достигат стойността на пълна положителна или пълна отрицателна корелация. В едно проучване на стрес и депресия с 68 възрастни, корелацията между двете променливи е +0,53 (Miller et al., 1976). Въпреки че тази корелация трудно може да се нарече абсолютна, нейната величина в психологическите изследвания се счита за голяма.

Статистически анализ на корелационни данни

Учените трябва да решат дали корелацията, която откриват в дадена група субекти, отразява точно истинската корелация в общата популация. Може ли наблюдаваната корелация да възникне само случайно? Учените могат да тестват своите открития със статистически анализ на данните, прилагайки принципите на вероятността. По същество те се чудят колко вероятно е данните от конкретно проучване да са получени случайно. Ако статистическият анализ показва, че има много малък шанс откритата корелация да се дължи на случайност, тогава изследователите наричат ​​корелацията статистически значима и заключават, че техните данни отразяват истинска корелация, която се среща повсеместно.

Предимства и недостатъци на корелационния метод

Методът на корелация има някои предимства пред изследването на отделни случаи на заболяването. Тъй като изследователите извличат своите променливи от множество примери и прилагат статистически анализ, те са по-способни да обобщават за хората, които изучават. Изследователите могат също да повтарят корелационни изследвания върху нови субекти, за да тестват своите открития.

Въпреки че корелационните изследвания позволяват на изследователите да опишат връзката между две променливи, те не обясняват връзката. Когато разгледаме положителните корелации, открити при изследване на различни стресови фактори в живота, може да се изкушим да заключим, че повишеният стрес води до по-тежка депресия. Всъщност обаче тези две променливи могат да бъдат свързани по една от трите причини: 1) стресът в живота може да доведе до депресия; 2) депресията може да накара хората да издържат повече стрес (например, депресивният подход към живота кара хората да управляват неправилно парите или депресията се отразява негативно на социалните им взаимоотношения); 3) Депресията и стресът в живота може да се дължат на трета променлива като бедността. Въпросите за причинно-следствената връзка изискват прилагането на експерименталния метод.

<Въпроси за размисъл.Как бихте обяснили значителната връзка между стреса в живота и депресията? Кое тълкуване според вас е най-точно?>

Специални форми на корелационно изследване

Два вида корелационни изследвания се използват широко от клиницистите - епидемиологични изследвания и дългосрочни (лонгитюдни) проучвания. Епидемиологичните проучвания разкриват общия брой на случаите и разпространението на дадено заболяване в определена популация (Weissman, 1995). Брой случаи - е броят на новите случаи на нарушения, възникнали в даден период от време. Разпространение - общия брой на случаите в популацията за даден период от време; разпространението на разстройство или заболяване включва както съществуващи, така и нови случаи.

През последните двадесет години клиницистите в Съединените щати разработиха най-обширното епидемиологично проучване, провеждано някога и го нарекоха Дистриктно епидемиологично проучване. Те интервюираха повече от 20 000 души в пет града, за да разберат разпространението на различни психични разстройства и какви програми са използвани за лечението им (Regier et al., 1993). Това проучване е сравнено с епидемиологични проучвания в други страни, за да се провери как нивата на психични разстройства и програмите за лечение варират по света (Weissman, 1995).

<Близнаци, корелация и наследственост. Проучванията на корелация на много двойки близнаци предполагат възможна връзка между генетични фактори и някои психиатрични разстройства. Еднояйчните близнаци (близнаци, които, като тези на снимката, имат идентични гени) показват висока степен на корелация при някои нарушения и тази корелация е по-висока от тази на неидентичните близнаци (тези с неидентични гени).>

Такива епидемиологични проучвания помагат на психолозите да идентифицират рискови групи, предразположени към определени разстройства. Оказва се, че при жените преобладава нивото на разстройствата, свързани с тревожност и депресия, за разлика от мъжете, при които преобладава по-високо ниво на алкохолизъм, отколкото при жените. По-възрастните хора имат по-висок процент на самоубийства от по-младите хора. Хората в някои незападни страни (като Тайван) имат по-висок процент на психична дисфункция от тези на Запад. Тези тенденции карат изследователите да предполагат, че някои специфични фактори и среда провокират определени видове разстройства (Rogers & Holloway, 1990). Например, влошаването на здравето при възрастните хора е по-вероятно да ги доведе до самоубийство; културни преси или нагласи, които преобладават в една страна, водят до определено ниво на психична дисфункция, което се различава от нивото на същата дисфункция в друга страна.

Епидемиологично проучване - изследване, което определя броя на случаите на заболяване и разпространението му сред даден сегмент от населението.

Брой случаи - броят на новите случаи на заболяването, възникнали в дадена популация за даден период от време.

Разпространение - общият брой на случаите на нарушения, които се появяват в даден сегмент от населението за определен период от време.

Провеждане дългосрочни изследвания,психолозите наблюдават едни и същи субекти в различни ситуации за дълъг период от време. В един такъв експеримент учените наблюдават в продължение на много години развитието на нормално функциониращи деца, чиито баща или майка страдат от шизофрения (Parnas, 1988; Mednick, 1971). Изследователите установиха, наред с други неща, че децата на родители с тежки форми на шизофрения са по-склонни да развият психични разстройства и да извършват престъпления в по-късните етапи от своето развитие.

Дългосрочно (надлъжно) проучване - изследване, при което едни и същи субекти се наблюдават за дълъг период от време.

Дял