Spearmanova korelačná analýza. Korelačná metóda – abstraktná

Korelačné metódy

Všetky javy spoločenského života sú vzájomne prepojené a vzájomne závislé. Úlohou štatistiky je identifikovať a merať súvislosti a závislosti medzi skúmanými javmi.

Vzájomne súvisiace znaky sa delia na faktoriálne (pod ich vplyvom sa menia iné znaky v závislosti od nich) a efektívne.

Vzťahy z hľadiska miery blízkosti môžu byť funkčné (pri ktorých určitá hodnota faktora zodpovedá presne definovanej hodnote produktívneho atribútu; na identifikáciu takéhoto spojenia stačí jedno pozorovanie), štatistické (keď niekoľko hodnôt ​​produktívneho atribútu môže zodpovedať rovnakej hodnote atribútu faktora; tieto súvislosti sa prejavujú vo väčšine prípadov a súčasne v priemere). Funkčné spojenia sa inak nazývajú úplné a štatistické - neúplné alebo korelačné.

Korelačná závislosť sa prejavuje iba v priemerných hodnotách a vyjadruje číselný pomer medzi nimi vo forme tendencie zvyšovania alebo znižovania jednej premennej so zvyšovaním alebo poklesom inej.

Korelácia je voľná, neúplná a nepresná.

Keďže korelácia je štatistická, prvou podmienkou možnosti jej štúdia je Všeobecná podmienka akákoľvek štatistická štúdia: dostupnosť údajov o dostatočne veľkom súbore javov. Pri jednotlivých javoch môžete získať úplne mylnú predstavu o vzťahu znakov, pretože v každom jednotlivom jave majú významy znakov okrem pravidelnej zložky náhodnú odchýlku (variáciu).

Druhou podmienkou pravidelného prejavu korelačného spojenia je podmienka, ktorá poskytuje spoľahlivé vyjadrenie pravidelnosti v priemernej hodnote. Okrem už naznačeného veľkého počtu jednotiek kameniva si to vyžaduje dostatočnú kvalitatívnu homogenitu kameniva. Porušenie tejto podmienky môže skresliť korelačné parametre.

Priame a spätné väzby. V závislosti od smeru pôsobenia môžu byť funkčné a stochastické spojenia priame a reverzné. Pri priamej súvislosti sa smer zmeny efektívneho atribútu zhoduje so smerom zmeny atribútu-faktora, to znamená, že s nárastom atribútu faktora rastie aj efektívny atribút, a naopak, s poklesom faktor faktor, efektívny atribút klesá. V opačnom prípade existujú spätné väzby medzi posudzovanými veličinami. Napríklad, čím vyššia je kvalifikácia pracovníka (rank), tým vyššia je úroveň produktivity práce - priama väzba. A čím vyššia produktivita práce, tým nižšie sú jednotkové náklady – spätná väzba.

Priame a zakrivené spojenia. Podľa analytického výrazu (formy) môžu byť spoje priame a krivočiare. Pri priamom spojení, s nárastom hodnoty faktora, dochádza k neustálemu zvyšovaniu (alebo znižovaniu) hodnôt efektívneho atribútu. Matematicky je takéto spojenie reprezentované priamkou rovnicou a graficky priamkou. Odtiaľ pochádza jeho kratší názov – lineárny odkaz. Pri krivočiarych spojeniach s nárastom hodnoty faktora faktora dochádza k nárastu (alebo poklesu) produktívneho atribútu nerovnomerne, prípadne je smer jeho zmeny obrátený. Geometricky sú takéto spojenia znázornené zakrivenými čiarami (hyperbola, parabola atď.).

Jednofaktorové a viacfaktorové vzťahy. Podľa počtu faktorov pôsobiacich na efektívnu vlastnosť sa spojenia líšia: jednofaktorové (jeden faktor) a multifaktoriálne (dva a viac faktorov). Jednofaktorové (jednoduché) vzťahy sa zvyčajne nazývajú párové (keďže sa uvažuje o dvojici znakov). Napríklad korelácia medzi ziskom a produktivitou práce. V prípade multifaktoriálneho (viacnásobného) spojenia znamenajú, že všetky faktory pôsobia komplexne, teda súčasne a vo vzájomnej súvislosti. Napríklad korelácia medzi produktivitou práce a úrovňou organizácie práce, automatizácia výroby, kvalifikácia pracovníkov, pracovné skúsenosti, prestoje a ďalšie faktorové ukazovatele. Pomocou viacnásobnej korelácie je možné pokryť celý komplex faktorových znakov a objektívne reflektovať existujúce viacnásobné vzťahy.

Na štúdium, meranie a kvantifikáciu vzťahov medzi javmi štatistika využíva rôzne metódy, ako napríklad: metódu porovnávania paralelných radov, bilančnú, grafickú, metódy analytických zoskupení, analýzu rozptylu a korelácie.

Metóda paralelných radov spočíva v tom, že materiály získané ako výsledok súhrnu a spracovania sú usporiadané vo forme paralelných radov a navzájom ich porovnávať, aby sa zistila povaha a tesnosť spojenia.

Bilančná metóda spočíva v tom, že údaje vzájomne súvisiacich ukazovateľov sú zobrazené vo forme tabuľky a sú usporiadané tak, aby súčty medzi jej jednotlivými časťami boli rovnaké, t. vyvážiť. Bilančná metóda sa používa na charakterizáciu vzťahu medzi výrobou a distribúciou produktov, peňažnými príjmami a výdavkami obyvateľstva a pod. takmer všetky vnútorné a vonkajšie ekonomické väzby sú vyjadrené vo forme bilancií.

Analytická metóda zoskupovania. Podstata metódy analytických zoskupení spočíva v tom, že jednotky štatistickej populácie sú zoskupené spravidla podľa faktorového kritéria a pre každú skupinu sa podľa výsledného kritéria vypočíta priemerná alebo relatívna hodnota. Potom sa zmeny v priemerných alebo relatívnych hodnotách efektívneho ukazovateľa porovnajú so zmenami vo faktorovom ukazovateli, aby sa zistila povaha vzťahu medzi nimi.

Korelačná a regresná analýza. Korelácia je vzťah, ktorý sa pri dostatočne veľkom počte pozorovaní prejavuje vo forme určitého vzťahu medzi priemernou hodnotou efektívnej vlastnosti a faktormi-znakmi.

Štúdium korelácií sa obmedzuje hlavne na riešenie nasledujúcich problémov:

  • - identifikácia prítomnosti (alebo neprítomnosti) korelácie medzi študovanými charakteristikami. Túto úlohu je možné riešiť na základe paralelného porovnávania (porovnávania) hodnôt X a pri pri n populačné jednotky; pomocou zoskupení; konštrukcia a analýza špeciálnych korelačných tabuliek; ako aj vytváranie rozptylových diagramov;
  • - meranie tesnosti vzťahu medzi dvoma (alebo viacerými) znakmi pomocou špeciálnych koeficientov. Táto časť štúdie sa nazýva korelačná analýza;
  • - stanovenie regresnej rovnice - matematický model, v ktorom je priemerná hodnota efektívneho ukazovateľa pri sa považuje za funkciu jednej alebo viacerých premenných - faktorových znakov. Táto časť štúdie sa nazýva regresná analýza.

Úlohou korelačnej analýzy je zmerať tesnosť vzťahu medzi premennými znakmi a posúdiť faktory, ktoré majú najväčší vplyv.

Úlohou regresnej analýzy je výber typu modelu (formy spojenia), ktorý určuje mieru vplyvu nezávislých premenných.

Spojenie znakov sa prejavuje v ich koordinovanej variácii, pričom niektoré znaky pôsobia ako faktoriálne a iné ako produktívne. Kauzálny vzťah faktorových a výsledných znakov je charakterizovaný stupňom:

  • - tesnosť;
  • - smer;
  • - analytický výraz.

Regresná analýza. Na odhad parametrov regresných rovníc sa najčastejšie používa metóda najmenších štvorcov (OLS), ktorej podstatou je nasledujúca požiadavka: hľadané teoretické hodnoty efektívneho ukazovateľa musia byť také, aby minimálny súčet štvorcov ich odchýlok od empirických (skutočných) hodnôt, tj ...

Pri skúmaní vzťahov medzi ukazovateľmi rôzneho druhu rovnice priameho a krivočiareho spojenia. Takže pri analýze priameho vzťahu sa používa nasledujúca rovnica:

Pri krivočiarej závislosti sa používa množstvo matematických funkcií:

semilogaritmický

orientačné

upokojiť

parabolický

hyperbolický

Najčastejšie používaná forma spojenia medzi korelovanými znakmi je lineárna, v prípade párovej korelácie je vyjadrená rovnicou, kde a 0 - priemerná hodnota v bode X= 0, teda neexistuje ekonomická interpretácia koeficientu; a 1 - regresný koeficient, ukazuje, ako veľmi sa mení hodnota efektívneho ukazovateľa v priemere so zvýšením hodnoty faktora o jednotku vlastného merania.

Systém normálnych rovníc OLS pre lineárnu párovú regresiu je nasledujúci:

Odtiaľ môžete vyjadriť regresné koeficienty:

Pre praktické využitie regresné modely musia kontrolovať ich primeranosť. Keď je počet analyzovaných objektov do 30 jednotiek, je potrebné skontrolovať, ako sú vypočítané parametre charakteristické pre zobrazený súbor podmienok, či získané hodnoty parametrov sú výsledkom náhodných príčin. Význam regresných koeficientov vo vzťahu k populácii n<30определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:

pre parameter а0:,

pre parameter a 1: .

štandardná odchýlka efektívneho ukazovateľa od zarovnaných hodnôt.

odmocnina odchýlka atribútu faktora od všeobecného priemeru.

Skutočné hodnoty získané pomocou vzorcov sa porovnávajú s kritickými, ktoré sa získajú podľa študentskej tabuľky, berúc do úvahy akceptovanú úroveň významnosti a počet stupňov voľnosti n (n = n-k- 1, kde n- počet pozorovaní, k- počet faktorov zahrnutých v regresnej rovnici). Vypočítané parametre a 0 a a 1 regresné rovnice sa považujú za typické ak t skutočné viac t kritický.

Korelačná analýza vám umožňuje určiť blízkosť vzťahu medzi faktormi a vyriešiť nasledujúce úlohy:

  • - aby som odpovedal na otázku: existuje súvislosť?
  • - identifikovať zmenu v komunikácii v rôznych situáciách reálnych dát;
  • - určiť najvýznamnejšie faktory v efektívnom ukazovateli;

Rozlíšiť:

  • - párová korelácia je vzťah medzi efektívnou a faktoriálnou vlastnosťou;
  • - čiastočná korelácia je vzťah medzi efektívnou a jednou faktoriálnou vlastnosťou s pevnou hodnotou ostatných faktorových vlastností;

Viacnásobný - viacfaktorový vplyv v statickom modeli.

Medzi najjednoduchšie ukazovatele blízkeho vzťahu patria:

  • - lineárny koeficient korelácie podľa K. Pirsona;
  • - koeficient determinácie;
  • - Znamenkové korelačné koeficienty - posúdiť blízkosť vzťahu kvalitatívnych znakov (neparametrické metódy), G. Fechner, K. Spearman, M. Candal.

Tesnosť spojenia s lineárnym vzťahom sa meria pomocou lineárneho korelačného koeficientu, ktorý sa vypočíta pomocou jedného zo vzorcov:

Korelačná analýza hodnotí primeranosť regresného modelu, ale stanovením tesnosti vzťahu.

Odhad koeficientu lineárnej korelácie

Významnosť lineárneho korelačného koeficientu sa kontroluje na základe Studentovho t-testu. Na tento účel sa určí skutočná hodnota kritéria:

Hodnota vypočítaná vzorcom sa porovnáva s kritickou, ktorá sa získa zo študentskej tabuľky, pričom sa berie do úvahy akceptovaná hladina významnosti a počet stupňov voľnosti n.

Korelačný koeficient sa považuje za štatisticky významný, ak t vypočítané presahuje ( t vyrovnanie>).

Univerzálnym ukazovateľom tesnosti komunikácie je teoretický korelačný pomer:

kde je celkový rozptyl empirických hodnôt r, charakterizuje variáciu efektívnej vlastnosti v dôsledku všetkých faktorov, vrátane X;

Faktorový rozptyl teoretických hodnôt efektívnej vlastnosti odráža vplyv faktora X pre variáciu pri;

Zvyškový rozptyl empirických hodnôt efektívnej vlastnosti odráža vplyv na variáciu pri všetky ostatné faktory okrem X.

Podľa pravidla sčítania rozptylu:

Posúdenie vzťahu na základe teoretického korelačného pomeru (Chaddockova stupnica)

Pre lineárnu závislosť je teoretický korelačný pomer zhodný s lineárnym korelačným koeficientom, t.j. s = | r |.

Viacnásobný korelačný koeficient v prípade závislosti efektívneho ukazovateľa od dvoch faktorov sa vypočíta podľa vzorca:

kde - párové korelačné koeficienty medzi znakmi.

Viacnásobný korelačný koeficient sa pohybuje od 0 do 1 a je podľa definície kladný:.

Význam koeficientu viacnásobného určenia, a teda aj primeranosť celého modelu a správnosť výberu formy komunikácie, možno skontrolovať pomocou Fisherovho kritéria:

kde R 2 - koeficient viacnásobného určenia ( R 2);

k- počet faktorových znakov zahrnutých v regresnej rovnici.

Vzťah sa považuje za významný, ak F vyrovnanie> F tabuľka - tabuľková hodnota F- kritérium pre danú úroveň významnosti a počet stupňov voľnosti

n 1 = k, n2 = n - k - 1.

Parciálne korelačné koeficienty charakterizujú mieru blízkosti vzťahu medzi efektívnym atribútom a faktorom, pričom eliminujú jeho vzťah s ostatnými faktormi zahrnutými do analýzy. V prípade závislosti pri z dvoch faktorových znakov sa vypočítajú parciálne korelačné koeficienty:

kde r- párové korelačné koeficienty medzi premennými uvedenými v indexe.

V prvom prípade je vylúčený vplyv atribútu faktora X 2, v druhom - X 1.

Na posúdenie komparatívnej sily vplyvu faktorov sa pre každý faktor vypočítajú parciálne koeficienty elasticity:

kde je priemerná hodnota zodpovedajúceho atribútu faktora;

Priemerná hodnota efektívnej vlastnosti;

Regresný koeficient pri i-faktoriálny atribút.

Tento koeficient ukazuje, o koľko percent treba očakávať zmenu efektívneho ukazovateľa, keď sa faktor zmení o 1 % a hodnota ostatných faktorov zostane nezmenená.

Čiastočný koeficient determinácie ukazuje percento variácie v efektívnom znaku v dôsledku variácie i-tá vlastnosť zahrnutá do viacnásobnej regresnej rovnice sa vypočíta podľa vzorca:

kde je párový korelačný koeficient medzi efektívnym a i-tý faktoriálny atribút;

Zodpovedajúci štandardizovaný koeficient viacnásobnej regresnej rovnice:

ZOZNAM POUŽITEJ LITERATÚRY

"Teória štatistiky", učebnica vyd. R.A. Shmoilova,

M .: Financie a štatistika, 2007 .-- 510 s.

"Workshop o teórii štatistiky." Ed. R.A. Shmoilova,

Moskva: Financie a štatistika, 2004 .-- 456 s.

"Všeobecná teória štatistiky" I.I. Eliseeva, M.M. Yuzbašev,

Moskva: Financie a štatistika, 2002 .-- 480 s.

"Teória štatistiky" V.M. Gusarov, M .: UNITI, 2001 .-- 247 s.

Korelácia - je to miera, do akej sú udalosti alebo osobné charakteristiky osoby vzájomne závislé. Korelačná metóda je postup vo výskume používaný na určenie vzťahu medzi premennými. Táto metóda môže napríklad odpovedať na otázku: "Existuje súvislosť medzi množstvom stresu, ktorému ľudia čelia, a stupňom depresie, ktorú zažívajú?" To znamená, že keď ľudia naďalej zažívajú stres, o koľko je pravdepodobnejšie, že upadnú do depresie?

Korelácia - stupeň závislosti udalostí alebo charakteristík na sebe.

Korelačná metóda - postup výskumu, ktorý sa používa na určenie toho, ako udalosti alebo charakteristiky navzájom závisia.

Na zodpovedanie tejto otázky výskumníci počítajú skóre životného stresu (napríklad počet ohrozujúcich udalostí, ktoré človek zažije v danom čase) a skóre depresie (napríklad skóre v dotazníkoch týkajúcich sa depresie). Výskumníci zvyčajne zisťujú, že tieto premenné sa zvyšujú alebo znižujú spolu (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To znamená, že čím vyšší je počet skóre stresu v živote konkrétneho človeka, tým vyššie je jeho celkové skóre depresie. Korelácie tohto druhu majú pozitívny smer a nazývajú sa pozitívnou koreláciou.

Korelácia môže byť skôr negatívna ako pozitívna. V negatívnej korelácii, keď hodnota jednej premennej rastie, hodnota druhej klesá. Vedci našli napríklad negatívnu koreláciu medzi depresiou a úrovňou aktivity. Čím viac je človek v depresii, tým je menej zaneprázdnený.

V korelačnej štúdii existuje aj tretí vzťah. Dve premenné nemusia spolu súvisieť, to znamená, že medzi nimi neexistuje konzistentný vzťah. Keď sa počet jednej premennej zvýši, výkon druhej premennej sa niekedy zvýši, inokedy zníži. Výskum napríklad zistil, že depresia a inteligencia sú na sebe nezávislé.

Okrem poznania smeru korelácie musia výskumníci poznať aj jej veľkosť alebo silu. To znamená, ako úzko spolu tieto dve premenné súvisia. Je jedna premenná vždy závislá od druhej, alebo je ich vzťah menej istý? Keď sa u mnohých subjektov zistí úzky vzťah dvoch premenných, potom sa korelácia považuje za vysokú alebo stabilnú.

Smer a veľkosť korelácie má často číselnú hodnotu a je vyjadrená v štatistickom koncepte - korelačný koeficient ( r ). Korelačný koeficient sa môže pohybovať od +1,00, čo znamená úplnú pozitívnu koreláciu medzi týmito dvoma premennými, do -1,00, čo znamená úplnú negatívnu koreláciu. Znamienko koeficientu (+ alebo -) udáva smerovosť korelácie; číslo predstavuje jeho veľkosť. Čím je koeficient bližšie k 0, tým je korelácia slabšia a jej hodnota je nižšia. Takže korelácie +0,75 a -0,75 majú rovnaké hodnoty a korelácia +,25 je slabšia ako obe korelácie.

Korelačný koeficient ( r ) - štatistický člen označujúci smer a veľkosť korelácie v rozsahu od -1,00 do +1,00.

Ľudské správanie sa mení a mnohé ľudské reakcie možno len zhruba odhadnúť. V psychologickom výskume preto korelácie nedosahujú hodnotu úplnej pozitívnej alebo úplnej negatívnej korelácie. V jednej štúdii stresu a depresie u 68 dospelých bola korelácia medzi týmito dvoma premennými +0,53 (Miller et al., 1976). Napriek tomu, že túto koreláciu možno len ťažko nazvať absolútnou, jej veľkosť sa v psychologickom výskume považuje za veľkú.

Štatistická analýza korelačných údajov

Vedci sa musia rozhodnúť, či korelácia, ktorú našli v danej skupine subjektov, presne odráža skutočnú koreláciu vo všeobecnej populácii. Mohla by pozorovaná korelácia nastať len náhodou? Vedci môžu otestovať svoje zistenia pomocou štatistickej analýzy údajov s použitím princípov pravdepodobnosti. V podstate sa čudujú, aká je pravdepodobnosť, že údaje z jedinej štúdie boli získané náhodou. Ak štatistická analýza naznačuje, že je veľmi nepravdepodobné, že pozorovaná korelácia bola získaná náhodou, potom výskumníci označujú koreláciu za štatisticky významnú a dospeli k záveru, že ich údaje odrážajú skutočnú koreláciu, ktorá sa nachádza všade.

Výhody a nevýhody korelačnej metódy

Korelačná metóda má oproti štúdiu individuálnych prípadov určité výhody. Pretože výskumníci odvodzujú svoje premenné z viacerých príkladov a aplikujú štatistickú analýzu, sú schopní lepšie zovšeobecniť údaje o ľuďoch, ktorých študovali. Výskumníci môžu tiež zopakovať korelačné štúdie na nových subjektoch, aby otestovali svoje zistenia.

Hoci korelačné štúdie umožňujú výskumníkom popísať vzťah medzi dvoma premennými, nevysvetľujú vzťah. Keď sa pozrieme na pozitívne korelácie zistené pri skúmaní rôznych životných stresov, môžeme byť v pokušení dospieť k záveru, že zvýšený stres vedie k väčšej depresii. V skutočnosti však tieto dve premenné mohli byť korelované z jedného z troch dôvodov: 1) životný stres môže viesť k depresii; 2) depresia môže spôsobiť, že ľudia budú znášať väčší stres (napríklad depresívny prístup k životu vedie k tomu, že ľudia budú zle hospodáriť s peniazmi alebo depresia negatívne ovplyvní ich sociálne vzťahy); 3) depresia a životný stres môžu byť spôsobené treťou premennou, akou je chudoba. Problémy kauzality si vyžadujú experimentálnu metódu.

<Otázky na zamyslenie. Ako by ste vysvetlili významnú koreláciu medzi životným stresom a depresiou? Ktorý výklad je podľa vás najpresnejší?>

Špeciálne formy korelačného výskumu

Lekári široko používajú dva typy korelačných štúdií - epidemiologické štúdie a dlhodobý (longitudinálny) výskum. Epidemiologické štúdie odhaľujú celkový počet prípadov a prevalenciu konkrétnej poruchy v špecifikovanej podskupine populácie (Weissman, 1995). Počet prípadov - je to počet nových prípadov poruchy, ktoré sa vyskytli za dané časové obdobie. Prevalencia - celkový počet prípadov v populácii v danom časovom období; prevalencia poruchy alebo choroby zahŕňa existujúce aj nové prípady.

Za posledných dvadsať rokov vyvinuli lekári v Spojených štátoch najväčšiu epidemiologickú štúdiu, aká bola kedy vykonaná, a nazvali ju District Epidemiological Study. Spýtali sa viac ako 20 000 ľudí v piatich mestách, aby zistili prevalenciu rôznych duševných porúch a aké programy sa použili na ich liečbu (Regier a kol., 1993). Táto štúdia bola porovnaná s epidemiologickými štúdiami v iných krajinách, aby sa otestovalo, ako sa úrovne duševných porúch a liečebné programy líšia vo svete (Weissman, 1995).

<Blíženci, korelácia a dedičnosť. Korelačné štúdie mnohých párov dvojčiat naznačujú možný vzťah medzi genetickými faktormi a niektorými duševnými poruchami. Jednovaječné dvojčatá (dvojčatá, ktoré ako tie, ktoré sú tu zobrazené, majú identické gény) vykazujú vysoký stupeň korelácie pri niektorých poruchách a táto korelácia je vyššia ako u neidentických dvojčiat (s neidentickými génmi).>

Takéto epidemiologické štúdie pomáhajú psychológom identifikovať rizikové skupiny, ktoré sú predisponované k určitým poruchám. Zdá sa, že ženy majú vyššiu prevalenciu úzkostných a depresívnych porúch ako muži, ktorí majú vyššiu mieru alkoholizmu ako ženy. Seniori majú vyššiu mieru samovrážd ako mladší ľudia. Ľudia v niektorých nezápadných krajinách (napríklad na Taiwane) majú vyššiu úroveň duševnej dysfunkcie ako na Západe. Tieto trendy vedú výskumníkov k špekuláciám, že špecifické faktory a prostredie spúšťajú určité typy porúch (Rogers & Holloway, 1990). Napríklad zhoršujúci sa zdravotný stav u starších ľudí s väčšou pravdepodobnosťou povedie k samovražde; kultúrna tlač alebo postoje prevládajúce v jednej krajine vedú k určitej úrovni duševných dysfunkcií, ktorá sa líši od úrovne rovnakých dysfunkcií v inej krajine.

Epidemiologický výskum - štúdia, ktorá zisťuje počet prípadov ochorenia a jeho prevalenciu medzi daným segmentom populácie.

Počet prípadov - počet nových prípadov poruchy vyskytujúcej sa v danom segmente populácie v určitom časovom období.

Prevalencia - celkový počet prípadov porúch vyskytujúcich sa v danom segmente populácie za určité časové obdobie.

Prenasledovaním dlhodobý výskum, psychológovia pozorujú rovnaké subjekty v rôznych situáciách počas dlhého časového obdobia. V jednom takomto experimente vedci počas mnohých rokov pozorovali vývoj normálne fungujúcich detí, ktorých otec alebo matka trpeli schizofréniou (Parnas, 1988; Mednick, 1971). Vedci okrem iného zistili, že deti rodičov s ťažkými formami schizofrénie mali v neskoršom vývoji častejšie mentálne abnormality a páchali zločiny.

Dlhodobý (longitudinálny) výskum - štúdium, v ktorom sa dlhodobo sledujú tie isté predmety.

Pri štúdiu verejného zdravia a zdravotnej starostlivosti na vedecké a praktické účely musí výskumník často vykonať štatistickú analýzu vzťahov medzi faktoriálnymi a efektívnymi ukazovateľmi štatistickej populácie (kauzálny vzťah) alebo určiť závislosť paralelných zmien niekoľkých charakteristík tejto populácie. populácie na nejakej tretej veličine (na ich spoločnej príčine ). Je potrebné vedieť študovať vlastnosti tohto spojenia, určiť jeho veľkosť a smer a tiež posúdiť jeho spoľahlivosť. Na tento účel sa používajú korelačné metódy.

  1. Typy prejavov kvantitatívnych vzťahov medzi znakmi
    • funkčný odkaz
    • korelačný odkaz
  2. Funkčné a korelačné definície

    Funkčné pripojenie- tento druh vzťahu medzi dvoma znakmi, keď každá hodnota jedného z nich zodpovedá presne definovanej hodnote druhého (plocha kruhu závisí od polomeru kruhu atď.). Funkčné spojenie je typické pre fyzikálne a matematické procesy.

    Korelačný odkaz- taký vzťah, v ktorom každá konkrétna hodnota jedného znaku zodpovedá niekoľkým hodnotám iného znaku, ktorý je s ním spojený (vzťah medzi výškou a telesnou hmotnosťou človeka; vzťah medzi telesnou teplotou a srdcovou frekvenciou atď.). Pre biomedicínske procesy je typická korelácia.

  3. Praktická hodnota stanovenia korelácie... Identifikácia vzťahu príčina-následok medzi faktoriálnymi a efektívnymi ukazovateľmi (pri hodnotení fyzický vývoj zisťovať vzťah medzi pracovnými podmienkami, každodenným životom a zdravotným stavom pri zisťovaní závislosti frekvencie ochorení od veku, odpracovanej doby, prítomnosti priemyselných nebezpečenstiev a pod.)

    Závislosť paralelných zmien viacerých znakov od nejakej tretej hodnoty. Napríklad vplyvom vysokých teplôt v dielni, zmien krvného tlaku, viskozity krvi, tepovej frekvencie atď.

  4. Hodnota charakterizujúca smer a silu spojenia medzi znakmi... Korelačný koeficient, ktorý v jednom čísle dáva predstavu o smere a sile spojenia medzi znakmi (javmi), o hraniciach jeho kolísania od 0 do ± 1
  5. Metódy reprezentácie korelácie
    • graf (bodový graf)
    • korelačný koeficient
  6. Smer korelácie
    • rovno
    • obrátene
  7. Korelačná sila
    • silný: ± 0,7 až ± 1
    • priemer: ± 0,3 až ± 0,699
    • slabé: 0 až ± 0,299
  8. Metódy stanovenia korelačného koeficientu a vzorce
    • metóda štvorcov (Pearsonova metóda)
    • metóda hodnotenia (Spearmanova metóda)
  9. Metodické požiadavky na použitie korelačného koeficientu
    • meranie vzťahu je možné len v kvalitatívne homogénnych populáciách (napríklad meranie vzťahu medzi výškou a hmotnosťou v populáciách, ktoré sú homogénne z hľadiska pohlavia a veku)
    • výpočet možno vykonať pomocou absolútnych alebo odvodených hodnôt
    • na výpočet korelačného koeficientu sa používajú nezoskupené variačné rady (táto požiadavka platí len pri výpočte korelačného koeficientu štvorcovou metódou)
    • počet pozorovaní nie je menší ako 30
  10. Odporúčania pre použitie metódy korelácie hodnosti (Spearmanova metóda)
    • kedy netreba presne zisťovať silu spojenia, ale len orientačné údaje
    • keď sú znaky prezentované nielen kvantitatívnymi, ale aj atribútovými hodnotami
    • keď séria distribúcie funkcií má otvorené možnosti (napríklad pracovné skúsenosti do 1 roka atď.)
  11. Odporúčania pre použitie metódy štvorcov (Pearsonova metóda)
    • keď je potrebné presne určiť silu spojenia medzi značkami
    • keď sú znaky iba kvantifikované
  12. Metodika a postup výpočtu korelačného koeficientu

    1) Štvorcová metóda

    2) Hodnostná metóda

  13. Schéma hodnotenia korelácie korelačným koeficientom
  14. Výpočet chyby korelačného koeficientu
  15. Hodnotenie spoľahlivosti korelačného koeficientu získaného metódou poradovej korelácie a metódou štvorcov

    Metóda 1
    Dôveryhodnosť sa určuje podľa vzorca:

    Kritérium t sa odhaduje podľa tabuľky hodnôt t s prihliadnutím na počet stupňov voľnosti (n - 2), kde n je počet spárovaných možností. Kritérium t musí byť rovnaké alebo väčšie ako tabuľkové, čo zodpovedá pravdepodobnosti p ≥ 99 %.

    Metóda 2
    Spoľahlivosť sa hodnotí pomocou špeciálnej tabuľky štandardných korelačných koeficientov. V tomto prípade sa takýto korelačný koeficient považuje za spoľahlivý, keď sa pre určitý počet stupňov voľnosti (n - 2) rovná alebo je väčší ako tabuľkový koeficient zodpovedajúci stupňu bezchybnej predikcie p ≥95 %.

o aplikácii metódy štvorcov

Cvičenie: vypočítajte korelačný koeficient, určte smer a silu vzťahu medzi množstvom vápnika vo vode a tvrdosťou vody, ak sú známe nasledujúce údaje (tab. 1). Posúďte spoľahlivosť pripojenia. Urobte záver.

stôl 1

Odôvodnenie výberu metódy. Na vyriešenie úlohy bola zvolená metóda štvorcov (Pearson), od r každý zo znakov (tvrdosť vody a množstvo vápnika) má číselné vyjadrenie; žiadna otvorená možnosť.

Riešenie.
Postupnosť výpočtov je popísaná v texte, výsledky sú uvedené v tabuľke. Po zostavení radov spárovaných porovnateľných atribútov ich označte pomocou x (tvrdosť vody v stupňoch) a cez y (množstvo vápnika vo vode v mg / l).

Tvrdosť vody
(v stupňoch)
Množstvo vápnika vo vode
(v mg/l)
d x d pri d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x = Σ x / n М у = Σ у / n Σ d x x d y = 7078 Σ d x 2 = 982 Σdy2 = 51056
Mx = 120/6 = 20 My = 852/6 = 142
  1. Určte priemerné hodnoty M x v riadku „x“ a M y v riadku „y“ podľa vzorcov:
    M x = Σx / n (stĺpec 1) a
    М у = Σу / n (stĺpec 2)
  2. Nájdite odchýlku (d x a d y) každej možnosti od hodnoty vypočítaného priemeru v riadku "x" a v riadku "y"
    d x = x - M x (graf 3) a dy = y - My (graf 4).
  3. Nájdite súčin odchýlok d x x d y a spočítajte ich: Σ d x x d y (stĺpec 5)
  4. Umocnite každú odchýlku d x a d y a spočítajte ich hodnoty pozdĺž riadku „x“ a riadku „y“: Σ d x 2 = 982 (stĺpec 6) a Σ d y 2 = 51056 (stĺpec 7).
  5. Určte súčin Σ d x 2 х Σ d y 2 a z tohto súčinu odoberte druhú odmocninu
  6. Získané hodnoty Σ (d x x d y) a √ (Σd x 2 x Σd y 2) dosadíme do vzorca na výpočet korelačného koeficientu:
  7. Určite spoľahlivosť korelačného koeficientu:
    1. spôsob. Nájdite chybu korelačného koeficientu (mr xy) a kritéria t podľa vzorcov:

    Kritérium t = 14,1, čo zodpovedá pravdepodobnosti bezchybnej predpovede p> 99,9 %.

    2. spôsob. Spoľahlivosť korelačného koeficientu sa hodnotí podľa tabuľky „Štandardné korelačné koeficienty“ (pozri prílohu 1). Pri počte stupňov voľnosti (n - 2) = 6 - 2 = 4 je nami vypočítaný korelačný koeficient r xy = + 0,99 väčší ako tabuľkový (r tab = + 0,917 pri p = 99 %).

    Záver.Čím viac vápnika je vo vode, tým je tvrdšia (väzba priame, silné a spoľahlivé: r xy = + 0,99, p > 99,9 %).

    o použití metódy hodnosti

    Cvičenie: použitím metódy hodnosti na určenie smeru a sily vzťahu medzi dĺžkou služby v rokoch a frekvenciou zranení, ak sa získajú tieto údaje:

    Zdôvodnenie výberu metódy: na vyriešenie problému je možné vybrať iba metódu korelácie hodnotenia, pretože prvý riadok znaku "pracovná prax v rokoch" má otvorené varianty (pracovná prax do 1 roka a 7 a viac rokov), čo neumožňuje presnejšou metódou - metódou štvorcov - nadviazať spojenie medzi porovnávané znaky.

    Riešenie... Postupnosť výpočtov je uvedená v texte, výsledky sú uvedené v tabuľke. 2.

    tabuľka 2

    Pracovné skúsenosti v rokoch Počet zranení Radové čísla (hodnoty) Rozdiel v poradí Rozdiel v poradí na druhú
    X Y d (x-y) d 2
    Do 1 roka 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 a viac 6 5 1 +4 16
    Σd2 = 38,5

    Štandardné korelačné koeficienty považované za spoľahlivé (podľa L.S.Kaminskyho)

    Počet stupňov voľnosti - 2 Úroveň pravdepodobnosti p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiológia. - M .: GEOTAR-MED, 2004 .-- 464 s.
    2. Lisitsyn Yu.P. Verejné zdravie a zdravotníctvo. Učebnica pre vysoké školy. - M .: GEOTAR-MED, 2007 .-- 512 s.
    3. Medic V.A., Yuriev V.K. Priebeh prednášok z verejného zdravotníctva a zdravotnej starostlivosti: 1. časť. Verejné zdravotníctvo. - M .: Medicína, 2003 .-- 368 s.
    4. Minyaev V.A., Vishnyakov N.I. a ďalšie organizácie sociálneho lekárstva a zdravotníctva (Sprievodca v 2 zväzkoch). - SPb, 1998. -528 s.
    5. Kucherenko V.Z., Agarkov N.M. a iné Organizácia sociálnej hygieny a zdravotnej starostlivosti ( Návod) - Moskva, 2000 .-- 432 s.
    6. S. Glantz. Biomedicínska štatistika. Per z angličtiny. - M., Prax, 1998 .-- 459 s.

Korelácia- je to miera, do akej sú udalosti alebo osobné charakteristiky osoby vzájomne závislé. Korelačná metóda je postup vo výskume používaný na určenie vzťahu medzi premennými. Táto metóda môže napríklad odpovedať na otázku: "Existuje súvislosť medzi množstvom stresu, ktorému ľudia čelia, a stupňom depresie, ktorú zažívajú?" To znamená, že keď ľudia naďalej zažívajú stres, o koľko je pravdepodobnejšie, že upadnú do depresie?

Korelácia- stupeň závislosti udalostí alebo charakteristík na sebe.

Korelačná metóda- postup výskumu, ktorý sa používa na určenie toho, ako udalosti alebo charakteristiky navzájom závisia.

Na zodpovedanie tejto otázky výskumníci počítajú skóre životného stresu (napríklad počet ohrozujúcich udalostí, ktoré človek zažije v danom čase) a skóre depresie (napríklad skóre v dotazníkoch týkajúcich sa depresie). Výskumníci zvyčajne zisťujú, že tieto premenné sa zvyšujú alebo znižujú spolu (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To znamená, že čím vyšší je počet skóre stresu v živote konkrétneho človeka, tým vyššie je jeho celkové skóre depresie. Korelácie tohto druhu majú pozitívny smer a nazývajú sa pozitívnou koreláciou.

Korelácia môže byť skôr negatívna ako pozitívna. V negatívnej korelácii, keď hodnota jednej premennej rastie, hodnota druhej klesá. Vedci našli napríklad negatívnu koreláciu medzi depresiou a úrovňou aktivity. Čím viac je človek v depresii, tým je menej zaneprázdnený.

V korelačnej štúdii existuje aj tretí vzťah. Dve premenné nemusia spolu súvisieť, to znamená, že medzi nimi neexistuje konzistentný vzťah. Keď sa počet jednej premennej zvýši, výkon druhej premennej sa niekedy zvýši, inokedy zníži. Výskum napríklad zistil, že depresia a inteligencia sú na sebe nezávislé.

Okrem poznania smeru korelácie musia výskumníci poznať aj jej veľkosť alebo silu. To znamená, ako úzko spolu tieto dve premenné súvisia. Je jedna premenná vždy závislá od druhej, alebo je ich vzťah menej istý? Keď sa u mnohých subjektov zistí úzky vzťah dvoch premenných, potom sa korelácia považuje za vysokú alebo stabilnú.

Smer a veľkosť korelácie má často číselnú hodnotu a je vyjadrená v štatistickom koncepte - korelačný koeficient (r). Korelačný koeficient sa môže pohybovať od +1,00, čo znamená úplnú pozitívnu koreláciu medzi týmito dvoma premennými, do -1,00, čo znamená úplnú negatívnu koreláciu. Znamienko koeficientu (+ alebo -) udáva smerovosť korelácie; číslo predstavuje jeho veľkosť. Čím je koeficient bližšie k 0, tým je korelácia slabšia a jej hodnota je nižšia. Takže korelácie +0,75 a -0,75 majú rovnaké hodnoty a korelácia +,25 je slabšia ako obe korelácie.

Korelačný koeficient (r)- štatistický člen označujúci smer a veľkosť korelácie v rozsahu od -1,00 do +1,00.

Ľudské správanie sa mení a mnohé ľudské reakcie možno len zhruba odhadnúť. V psychologickom výskume preto korelácie nedosahujú hodnotu úplnej pozitívnej alebo úplnej negatívnej korelácie. V jednej štúdii stresu a depresie u 68 dospelých bola korelácia medzi týmito dvoma premennými +0,53 (Miller et al., 1976). Napriek tomu, že túto koreláciu možno len ťažko nazvať absolútnou, jej veľkosť sa v psychologickom výskume považuje za veľkú.


Korelačná analýza (z latinského „pomer“, „spojenie“) sa používa na testovanie hypotézy o štatistickej závislosti hodnôt dvoch alebo viacerých premenných v prípade, že ich výskumník môže zaregistrovať (zmerať), ale nie kontrolovať. (zmena).

Keď je zvýšenie úrovne jednej premennej sprevádzané zvýšením úrovne inej, potom hovoríme o pozitívnej korelácii. Ak k rastu jednej premennej dôjde s poklesom úrovne druhej, potom sa hovorí o negatívnej korelácii. Pri absencii spojenia medzi premennými máme do činenia s nulovou koreláciou.

V tomto prípade môžu byť premennými údaje z testov, pozorovaní, experimentov, sociodemografické charakteristiky, fyziologické parametre, charakteristiky správania atď. profesionálne úspechy po ukončení štúdia, úroveň ašpirácií a stresu, počet detí v rodine a kvalita ich inteligencie, osobnostné vlastnosti a profesijná orientácia, trvanie osamelosti a dynamika sebaúcty, úzkosť a vnútroskupinový status, sociálna adaptabilita a agresivita v konflikte...

Ako pomôcka sú korelačné postupy nevyhnutné pri navrhovaní testov (na určenie platnosti a spoľahlivosti merania), ako aj pilotné akcie na testovanie vhodnosti experimentálnych hypotéz (skutočnosť, že neexistuje žiadna korelácia, nám umožňuje zamietnuť predpoklad kauzálneho vzťahu medzi premennými).

Rastúci záujem psychologickej vedy o potenciál korelačnej analýzy je spôsobený niekoľkými dôvodmi. Po prvé, je dovolené študovať širokú škálu premenných, ktorých experimentálne overenie je ťažké alebo nemožné. Napríklad z etických dôvodov je nemožné uskutočniť experimentálne štúdie samovrážd, drogovej závislosti, deštruktívnych rodičovských vplyvov, vplyvu autoritárskych siekt. Po druhé, je možné v krátkom čase získať cenné zovšeobecnenia údajov o veľkom počte skúmaných osôb. Po tretie, je známe, že mnohé javy menia svoje špecifiká počas prísnych laboratórnych experimentov. Korelačná analýza poskytuje výskumníkovi možnosť pracovať s informáciami získanými za podmienok čo najbližšie reálnym. Po štvrté, realizácia štatistického skúmania dynamiky tej či onej závislosti často vytvára predpoklady na spoľahlivé predpovedanie psychologických procesov a javov.

Treba si však uvedomiť, že použitie korelačnej metódy je spojené s veľmi významnými zásadnými obmedzeniami.

Je teda známe, že premenné môžu dobre korelovať v neprítomnosti kauzálneho vzťahu medzi nimi.

Niekedy je to možné v dôsledku pôsobenia náhodných dôvodov, s heterogenitou vzorky, v dôsledku neadekvátnosti výskumných nástrojov pre stanovené úlohy. Takáto falošná korelácia sa môže stať povedzme „dôkazom“, že ženy sú disciplinovanejšie ako muži, adolescenti z r. rodiny s jedným rodičom sú náchylnejší k delikvencii, extroverti sú agresívnejší ako introverti atď. Skutočne stojí za to vybrať mužov pracujúcich na vysokých školách a ženy napríklad zo sektora služieb do jednej skupiny a oboch dokonca otestovať na znalosti vedeckej metodológie , potom dostávame vyjadrenie badateľnej závislosti kvality uvedomenia od pohlavia. Dá sa takejto korelácii veriť?

Ešte častejšie sa azda vo výskumnej praxi vyskytujú prípady, keď sa obe premenné menia pod vplyvom nejakej tretej alebo aj viacerých skrytých determinantov.

Ak premenné označíme číslami a šípkami – smery od príčin k následkom, uvidíme celý rad možných možností:

1→ 2→ 3→ 4

1← 2← 3→ 4

1← 2→ 3→ 4

1← 2← 3← 4

Nedostatočná pozornosť pôsobeniu reálnych faktorov, ktorú výskumníci nezohľadnili, umožnila odôvodniť skutočnosť, že inteligencia je čisto zdedená formácia (psychogenetický prístup), alebo naopak, že je podmienená iba k vplyvu sociálnych zložiek vývoja (sociogenetický prístup). V psychológii si treba uvedomiť, že javy, ktoré majú jednoznačnú základnú príčinu, nie sú rozšírené.

Okrem toho skutočnosť, že medzi premennými existuje vzťah, neumožňuje na základe výsledkov korelačnej štúdie identifikovať príčinu a následok, a to ani v prípadoch, keď neexistujú žiadne prechodné premenné.

Napríklad pri skúmaní agresivity detí sa zistilo, že deti so sklonom k ​​krutosti častejšie pozerajú filmy so scénami násilia ako ich rovesníci. Znamená to, že takéto scény vyvolávajú agresívne reakcie alebo naopak takéto filmy lákajú tie najagresívnejšie deti? Na túto otázku nie je možné dať v rámci korelačnej štúdie legitímnu odpoveď.

Je potrebné si zapamätať: prítomnosť korelácií nie je indikátorom závažnosti a smerovania vzťahu príčina-následok.

Inými slovami, po stanovení korelácie premenných môžeme posudzovať nie o determinantoch a derivátoch, ale len o tom, ako úzko sú zmeny v premenných prepojené a ako jedna z nich reaguje na dynamiku druhej.

Pri použití tejto metódy sa používa jeden alebo druhý druh korelačného koeficientu. Jeho číselná hodnota sa zvyčajne pohybuje od -1 (inverzný vzťah premenných) do +1 (priamy vzťah). V tomto prípade nulová hodnota koeficientu zodpovedá úplnej absencii vzťahu medzi dynamikou premenných.

Napríklad korelačný koeficient +0,80 odráža výraznejší vzťah medzi premennými ako koeficient +0,25. Podobne vzťah medzi premennými charakterizovaný koeficientom -0,95 je oveľa bližší ako ten, kde koeficienty majú hodnoty +0,80 alebo + 0,25 („mínus“ nám len naznačuje, že rast jednej premennej je sprevádzaný znížením druhého) ...

V praxi psychologického výskumu ukazovatele korelačných koeficientov zvyčajne nedosahujú +1 alebo -1. Môžeme hovoriť len o jednom alebo druhom stupni priblíženia sa tejto hodnote. Často sa korelácia považuje za silnú, ak je jej koeficient väčší ako ± 0,60. V tomto prípade sa za nedostatočnú koreláciu spravidla považujú ukazovatele umiestnené v rozmedzí od -0,30 do +0,30.

Malo by sa však okamžite stanoviť, že interpretácia prítomnosti korelácie vždy predpokladá určenie kritických hodnôt zodpovedajúceho koeficientu. Pozrime sa na tento moment podrobnejšie.

Pokojne sa môže stať, že korelačný koeficient +0,50 v niektorých prípadoch nebude uznaný ako spoľahlivý a koeficient +0,30 bude za určitých podmienok charakteristikou nepopierateľnej korelácie. Tu veľa závisí od dĺžky radu premenných (t. j. od počtu porovnávaných ukazovateľov), ako aj od zadanej hodnoty hladiny významnosti (alebo od akceptovanej pravdepodobnosti chyby vo výpočtoch).

Na jednej strane, čím väčšia vzorka, tým menší kvantitatívny koeficient sa bude považovať za spoľahlivý dôkaz korelačných vzťahov. Na druhej strane, ak sme pripravení akceptovať značnú pravdepodobnosť chyby, potom môžeme počítať s dostatočne malou hodnotou korelačného koeficientu.

Existujú štandardné tabuľky s kritickými hodnotami korelačných koeficientov. Ak sa nami získaný koeficient ukáže byť nižší, ako je uvedený v tabuľke pre túto vzorku na stanovenej hladine významnosti, potom sa považuje za štatisticky nespoľahlivý.

Pri práci s takouto tabuľkou by ste si mali uvedomiť, že za prahovú hodnotu hladiny významnosti v psychologickom výskume sa zvyčajne považuje 0,05 (alebo päť percent). Samozrejme, riziko, že sa pomýlite, je ešte menšie, ak je pravdepodobnosť 1 ku 100, alebo ešte lepšie 1 ku 1000.

Nie hodnota vypočítaného korelačného koeficientu teda sama osebe slúži ako základ na posúdenie kvality vzťahu premenných, ale ako štatistické rozhodnutie o tom, či vypočítaný koeficient koeficientu možno považovať za spoľahlivý.

Keď to vieme, pristúpme k štúdiu konkrétnych metód na určenie korelačných koeficientov.

Významne prispel k rozvoju štatistického aparátu korelačného výskumu anglický matematik a biológ Carl Pearson (1857-1936), ktorý sa svojho času zaoberal testovaním evolučnej teórie Charlesa Darwina.

Označenie Pearsonovho korelačného koeficientu (r) pochádza z konceptu regresie - operácie na redukciu množiny čiastkových závislostí medzi jednotlivými hodnotami premenných na ich spojitú (lineárnu) spriemerovanú závislosť.

Vzorec na výpočet Pearsonovho koeficientu je nasledujúci:

kde x, y- konkrétne hodnoty premenných, S- (sigma) - označenie súčtu a - stredné hodnoty tých istých premenných. Zvážte postup použitia tabuľky kritických hodnôt Pearsonových koeficientov. Ako vidíme, počet stupňov voľnosti je uvedený v jeho ľavom stĺpci. Pri určovaní línie, ktorú potrebujeme, vychádzame zo skutočnosti, že požadovaný stupeň voľnosti sa rovná n-2, kde n- množstvo údajov v každom z korelovaných radov. V stĺpcoch umiestnených na pravej strane sú uvedené konkrétne hodnoty modulov koeficientov.

Navyše, čím viac vpravo je stĺpec čísel umiestnený, tým vyššia je spoľahlivosť korelácie, tým istejšie je štatistické rozhodnutie o jej významnosti.

Ak napríklad korelujeme dve série čísel po 10 jednotkách v každej z nich a pomocou Pearsonovho vzorca získame koeficient rovný +0,65, potom sa bude považovať za významný na úrovni 0,05 (pretože viac ako kritická hodnota 0,632 pre pravdepodobnosť 0,05 a menej ako kritická hodnota 0,715 pre pravdepodobnosť 0,02). Táto hladina významnosti naznačuje významnú pravdepodobnosť opakovania tejto korelácie v podobných štúdiách.

Teraz uvedieme príklad výpočtu Pearsonovho korelačného koeficientu. Nech je v našom prípade potrebné určiť povahu súvislosti medzi vykonaním dvoch testov tými istými osobami. Údaje pre prvý z nich sú označené ako X, a na druhom - as r.

Na zjednodušenie výpočtov sú zavedené niektoré identity. menovite:

Zároveň máme tieto výsledky predmetov (v testovacích bodoch):

Všimnite si, že počet stupňov voľnosti je v našom prípade rovný 10. Podľa tabuľky kritických hodnôt Pearsonových koeficientov zistíme, že pre daný stupeň voľnosti na hladine významnosti 0,999 je akýkoľvek ukazovateľ korelácia premenných vyššia ako 0,823 sa bude považovať za spoľahlivú. To nám dáva právo považovať získaný koeficient za dôkaz nepochybnej korelácie radu X a r.

Použitie koeficientu lineárnej korelácie sa stáva nezákonným v tých prípadoch, keď sa výpočty vykonávajú v rámci ordinálnej, a nie intervalovej meracej stupnice. Potom sa použijú koeficienty poradovej korelácie. Samozrejme, v tomto prípade sú výsledky získané menej presné, keďže porovnávaniu nepodliehajú samotné kvantitatívne charakteristiky, ale len poradie ich postupnosti.

Medzi poradové korelačné koeficienty v praxi psychologický výskum pomerne často sa používa tá, ktorú navrhol anglický vedec Charles Spearman (1863-1945), slávny vývojár dvojfaktorovej teórie inteligencie.

Pomocou zodpovedajúceho príkladu zvážte kroky potrebné na určenie Spearmanovho koeficientu korelácie hodnosti.

Vzorec na jej výpočet je nasledujúci:

kde d- rozdiely medzi stupňami každej premennej zo série X a r,

n- počet spárovaných párov.

Nechaj X a r- ukazovatele úspešnosti subjektov vykonávajúcich určité druhy činností (hodnotenie individuálnych úspechov). Zároveň máme tieto údaje:

Všimnite si, že po prvé, ukazovatele sú v sérii zoradené samostatne X a r... Ak v tomto prípade existuje niekoľko rovnakých premenných, potom sa im priradí rovnaké priemerné poradie.

Potom sa rozdiel v poradí určí vo dvojiciach. Znamienko rozdielu je nevýznamné, pretože je odmocnené vzorcom.

V našom príklade súčet druhých mocnín rozdielov v poradí ∑ d 2 sa rovná 178. Dosaďte výsledné číslo do vzorca:

Ako vidíme, ukazovateľ korelačného koeficientu je v tomto prípade zanedbateľný. Porovnajme to však s kritickými hodnotami Spearmanovho koeficientu zo štandardnej tabuľky.

Záver: medzi určenými riadkami premenných X a r neexistuje žiadna korelácia.

Je potrebné poznamenať, že použitie postupov hodnostnej korelácie poskytuje výskumníkovi možnosť určiť pomery nielen kvantitatívnych, ale aj kvalitatívnych znakov, v prípade, že, samozrejme, tieto možno zoradiť vzostupne podľa závažnosti ( zoradené).

Zvažovali sme najbežnejšie, možno v praxi, metódy na určenie korelačných koeficientov. Ďalšie, zložitejšie alebo menej často používané varianty tejto metódy, ak je to potrebné, možno nájsť v materiáloch príručiek venovaných meraniam vo vedeckom výskume.


Zdieľajte to