kategorier
...

Korrelations- och regressionsanalys: exempel, uppgifter, tillämpning. Metod för korrelation och regressionsanalys

Analys av korrelationsregression - Detta är en av de vanligaste metoderna för att studera förhållandet mellan numeriska värden. Dess huvudmål är att hitta förhållandet mellan de två parametrarna och dess grad med den efterföljande härledningen av ekvationen. Till exempel har vi studenter som har godkänt matematiska och engelska tentamen. Vi kan använda korrelation för att avgöra om framgången för ett test påverkar resultaten i ett annat ämne. Beträffande regressionsanalys, hjälper det att förutsäga matematiska betyg baserat på poäng som poängsats i en engelska tentamen, och vice versa.

korrelationsregressionsanalys

Vad är ett korrelationsschema?

Varje analys börjar med insamlingen av information. Ju mer det är, desto mer exakt erhålls resultatet i slutändan. I exemplet ovan har vi två discipliner där studenter måste klara en tentamen. Deras framgångsgrad är en uppskattning. Korrelations-regressionsanalys visar om resultatet av ett ämne påverkar poängens poäng i den andra tentamen. För att besvara denna fråga är det nödvändigt att analysera betyg för alla studenter parallellt. Men först måste du bestämma den beroende variabeln. I det här fallet är det inte så viktigt. Anta att en matteexamen ägde rum tidigare. Poäng på den är en oberoende variabel (de skjuts upp längs abscissen). Engelska står på schemat senare. Därför är uppskattningar baserade på den en beroende variabel (ritas ut längs ordinaten). Ju mer grafen som sålunda erhålls ser ut som en rak linje, desto starkare blir den linjära korrelationen mellan de två valda värdena. Detta innebär att studenter i matematik är mer benägna att få femmor i engelska examen.

Antaganden och förenklingar

Metoden för korrelation och regressionsanalys innefattar att hitta en orsakssamband. I det första steget måste du dock förstå att förändringar i båda kvantiteterna kan bero på en tredjedel, som ännu inte beaktats av forskaren. Det kan också finnas icke-linjära förhållanden mellan variablerna, därför är det inte slutet på experimentet att få en koefficient lika med noll.

exempel på korrelationsregressionsanalys

Pearson linjär korrelation

Denna koefficient kan användas under två förhållanden. Den första - alla värden på variablerna är rationella siffror, den andra - det förväntas att värdena ändras proportionellt. Denna koefficient är alltid mellan -1 och 1. Om den är större än noll, finns det ett direkt proportionellt beroende, mindre - omvänt, lika - dessa värden påverkar inte varandra på något sätt. Förmågan att beräkna denna indikator är basen för korrelations- och regressionsanalys. För första gången utvecklades denna koefficient av Karl Pearson baserat på idéen om Francis Galton.

Egenskaper och försiktighetsåtgärder

Pearsons korrelationskoefficient är ett kraftfullt verktyg, men det bör också användas med försiktighet. Följande varningar används:

  1. Pearson-koefficienten indikerar närvaron eller frånvaron av en linjär relation. Korrelations-regressionsanalys slutar inte där, det kan visa sig att variablerna inte desto mindre är sammankopplade.
  2. Man måste vara försiktig när man tolkar koefficientvärdet. En korrelation kan hittas mellan benstorlek och IQ-nivå.Men detta betyder inte att en indikator bestämmer en annan.
  3. Pearson-koefficienten säger ingenting om orsakssambandet mellan indikatorerna.

metod för korrelationsregressionsanalys

Spearmans rankningskorrelationskoefficient

Om en förändring i värdet på en indikator leder till en ökning eller minskning av värdet på en annan, betyder det att de är relaterade. Korrelations-regressionsanalys, varvid ett exempel kommer att ges nedan, är exakt kopplat till sådana parametrar. Rankkoefficient låter dig förenkla beräkningarna.

Korrelations- och regressionsanalys: ett exempel

Anta att det finns en bedömning av effektiviteten hos tio företag. Vi har två domare som ger dem poäng. Korrelations- och regressionsanalys av företaget i detta fall kan inte utföras på grundval av den linjära Pearson-koefficienten. Vi är inte intresserade av förhållandet mellan domarnas betyg. Företagens rang enligt domarna är viktiga.

Denna typ av analys har följande fördelar:

  • Icke-parametrisk form av förhållanden mellan de studerade mängderna.
  • Användarvänlighet, eftersom raderna kan tillskrivas både i stigande ordningsvärde och fallande ordning.

Det enda kravet för denna typ av analys är behovet av att konvertera källdata.

grunderna i korrelationsregressionsanalys

Applikationsproblem

Korrelations- och regressionsanalysen är baserad på följande antaganden:

  • Observationer betraktas som oberoende (en femfaldig förlust av "örnen" påverkar inte resultatet av nästa myntflip).
  • I korrelationsanalysen betraktas båda variablerna som slumpmässiga. Vid regression - bara en (beroende).
  • Vid testning av en hypotes måste en normal distribution observeras. Förändringen i den beroende variabeln bör vara densamma för varje värde på abscissen.
  • Korrelationsdiagrammet är bara det första testet i hypotesen om förhållandet mellan de två parametrarna och inte slutresultatet av analysen.

tillämpning av korrelationsregressionsanalys

Beroende och orsakssamband

Anta att vi har beräknat korrelationskoefficienten för exportvolym och BNP. Det visade sig vara lika med enhetsmodulo. Har vi gjort korrelations- och regressionsanalys till slutet? Naturligtvis inte. Det erhållna resultatet betyder inte alls att BNP kan uttryckas genom export. Vi har ännu inte bevisat ett orsakssamband mellan indikatorer. Korrelations-regressionsanalys - prognoser värdena på en variabel baserad på en annan. Men du måste förstå att ofta många faktorer påverkar parametern. Export avgör BNP, men inte bara den. Det finns andra faktorer. Här finns en korrelation och ett orsakssamband, om än justerat för andra komponenter i bruttonationalprodukten.

En annan situation är mycket farligare. I Storbritannien genomfördes en undersökning som visade att barn vars föräldrar rökt var ofta gärningsmän. Denna slutsats är baserad på en stark korrelation mellan indikatorn. Men har han rätt? För det första kan beroendet vara omvänt. Föräldrar kan börja röka på grund av stress från det faktum att deras barn ständigt får förändringar och bryter mot lagen. För det andra kan båda parametrarna bero på den tredje. Sådana familjer tillhör låga sociala klasser, som kännetecknas av båda problemen. Baserat på korrelationen kan det därför inte dras slutsatsen att det finns ett orsakssamband.

prognoser korrelationsregressionsanalys

Varför använda regressionsanalys?

Korrelationsberoende innebär att hitta samband mellan kvantiteter. Orsakssambandet i detta fall förblir bakom kulisserna. Korrelations- och regressionsanalysens uppgifter sammanfaller endast när det gäller att bekräfta att det finns ett samband mellan värdena på två kvantiteter. Först uppmärksammar dock forskaren inte möjligheten till ett kausalt samband. Regressionsanalys har alltid två variabler, varav en är beroende. Det sker i flera steg:

  1. Att välja rätt modell med den minsta kvadratmetoden.
  2. Avledning av en ekvation som beskriver effekten av en förändring i en oberoende variabel på en annan.

Om vi ​​till exempel studerar effekten av ålder på människors tillväxt, kan en regressionsanalys hjälpa till att förutsäga förändringar genom åren.

företagskorrelationsanalys

Linjär och multipel regression

Anta att X och Y är två relaterade variabler. Regressionsanalys tillåter oss att förutsäga storleken på en av dem baserat på värdena på den andra. Till exempel är mognad och ålder beroende symtom. Förhållandet mellan dem återspeglas med hjälp av linjär regression. I själva verket kan du uttrycka X till och med Y eller vice versa. Men ofta är bara en av regressionslinjerna korrekt. Analysens framgång beror till stor del på korrekt bestämning av den oberoende variabeln. Vi har till exempel två indikatorer: utbyte och nederbörd. Från vardagsupplevelsen blir det tydligt att den första beror på den andra och inte tvärtom.

Med flera regression kan du beräkna ett okänt värde baserat på värdena för tre eller flera variabler. Till exempel beror risutbytet per tunnland mark av spannmålskvalitet, markens fertilitet, gödselmedel, temperatur och nederbörd. Alla dessa parametrar påverkar det totala resultatet. För att förenkla modellen används följande antaganden:

  • Förhållandet mellan oberoende och påverkande egenskaper är linjärt.
  • Multikollinearitet är utesluten. Detta innebär att beroende variabler inte är sammankopplade.
  • Homoskedasticitet och normalitet i serie av nummer.

Användning av korrelations- och regressionsanalys

Det finns tre huvudfall att använda denna metod:

  1. Testa avslappnade förhållanden mellan kvantiteter. I detta fall bestämmer forskaren värdena på variabeln och finner ut om de påverkar förändringen i den beroende variabeln. Till exempel kan du ge människor olika doser av alkohol och mäta deras blodtryck. I det här fallet vet forskaren med säkerhet att den första är orsaken till den andra och inte tvärtom. Korrelations-regressionsanalys gör att du kan upptäcka ett direkt proportionellt linjärt samband mellan dessa två variabler och härleda en formel som beskriver den. I detta fall kan värden uttryckta i helt olika måttenheter jämföras.
  2. Hitta ett förhållande mellan två variabler utan att utöka ett kausalt förhållande till dem. I det här fallet är det ingen skillnad vilken storlek forskaren kallar beroende på. Dessutom kan det i verkligheten visa sig att båda av dem påverkas av den tredje variabeln, därför förändras de proportionellt.
  3. Beräkning av värden för en kvantitet baserad på en annan. Det är baserat på en ekvation där kända siffror ersätts.

Således innebär korrelationsanalys att hitta en koppling (inte kausal) mellan variabler, och regressionsanalys förklarar den, ofta med en matematisk funktion.


Lägg till en kommentar
×
×
Är du säker på att du vill ta bort kommentaren?
Radera
×
Anledning till klagomål

Affärs

Framgångshistorier

utrustning