kategorije
...

Korelacijska i regresijska analiza: primjer, zadaci, primjena. Metoda korelacijske i regresijske analize

Korelacijska regresijska analiza - Ovo je jedna od najčešćih metoda za proučavanje odnosa brojčanih vrijednosti. Njegov glavni cilj je pronaći odnos između dvaju parametara i njegovog stupnja s naknadnom izvedbom jednadžbe. Na primjer, imamo studente koji su položili ispit iz matematike i engleskog jezika. Pomoću korelacije možemo utvrditi utječe li uspjeh jednog testa na rezultate drugog predmeta. Što se tiče regresijske analize, pomaže vam predvidjeti ocjene iz matematike na temelju bodova postignutih na ispitu iz engleskog jezika i obrnuto.

korelacijska regresijska analiza

Što je korelacijska shema?

Svaka analiza započinje prikupljanjem informacija. Što je više, točniji je rezultat na kraju. U gornjem primjeru imamo dvije discipline u kojima studenti trebaju položiti ispit. Njihova stopa uspjeha je procjena. Korelacijsko-regresijska analiza pokazuje utječe li rezultat jednog predmeta na bodove postignute na drugom ispitu. Da bi se odgovorilo na ovo pitanje, potrebno je paralelno analizirati ocjene svih učenika. Ali prvo morate odlučiti o zavisnoj varijabli. U ovom slučaju nije toliko važno. Pretpostavimo da se ispit iz matematike položio i ranije. Točke na njemu su neovisna varijabla (one se odgađaju duž apsces). Engleski jezik je na rasporedu kasnije. Stoga su procjene temeljene na njemu ovisna varijabla (crtane su duž ordinate). Što više dobiveni graf izgleda kao ravna linija, to je jača linearna korelacija između dviju odabranih vrijednosti. To znači da će studenti matematike vjerojatnije dobiti petice na ispitu iz engleskog jezika.

Pretpostavke i pojednostavljenja

Metoda korelacijske i regresijske analize uključuje pronalaženje uzročno-posljedične veze. Međutim, na prvoj fazi trebate shvatiti da promjene u obje količine mogu biti posljedice neke trećine, koje istraživač još nije uzeo u obzir. Također mogu postojati nelinearni odnosi između varijabli, stoga dobivanje koeficijenta jednakog nuli nije kraj eksperimenta.

primjer korelacijske regresijske analize

Pearsonova linearna korelacija

Ovaj se koeficijent može koristiti pod dva uvjeta. Prvo - sve vrijednosti varijabli su racionalni brojevi, drugo - očekuje se da se vrijednosti proporcionalno mijenjaju. Taj je koeficijent uvijek između -1 i 1. Ako je veći od nule, tada postoji izravno proporcionalna ovisnost, manje - obrnuto, jednaka - te vrijednosti ni na koji način ne utječu jedna na drugu. Sposobnost izračunavanja ovog pokazatelja osnova je korelacijske i regresijske analize. Po prvi put je ovaj koeficijent razvio Karl Pearson na temelju ideje Francisca Galtona.

Svojstva i oprezi

Pearsonov koeficijent korelacije moćan je alat, ali također ga treba koristiti s oprezom. Sljedeća upozorenja su u njegovoj upotrebi:

  1. Pearsonov koeficijent označava prisutnost ili odsutnost linearnog odnosa. Tu se ne završava korelacijsko-regresijska analiza, može se ispostaviti da su varijable međusobno povezane.
  2. Morate biti oprezni u tumačenju vrijednosti koeficijenta. Može se pronaći povezanost između veličine nogu i razine IQ-a.Ali to ne znači da jedan pokazatelj određuje drugi.
  3. Pearsonov koeficijent ne govori ništa o uzročno-posledičnoj vezi između pokazatelja.

korelacijska regresijska analiza

Spearmanov koeficijent korelacije rangiranja

Ako promjena vrijednosti jednog pokazatelja dovodi do povećanja ili smanjenja vrijednosti drugog, to znači da su oni povezani. Korelacijsko-regresijska analiza, čiji ćemo primjer dati u nastavku, upravo je povezana s takvim parametrima. Koeficijent ranga omogućuje vam pojednostavljenje izračuna.

Korelacijska i regresijska analiza: primjer

Pretpostavimo da postoji procjena učinkovitosti deset poduzeća. Imamo dva suca koji im daju bodove. Korelacijska i regresijska analiza poduzeća u ovom se slučaju ne može provesti na temelju linearnog Pearsonovog koeficijenta. Ne zanima nas odnos ocjena sudaca. Važni su redovi poduzeća prema sucima.

Ova vrsta analize ima sljedeće prednosti:

  • Neparametrični oblik odnosa između ispitivanih veličina.
  • Jednostavnost upotrebe, jer se redovi mogu pripisati uzlaznim redoslijedom i silaznim redoslijedom.

Jedini zahtjev ove vrste analiza je potreba za pretvaranjem izvornih podataka.

osnove korelacijske regresijske analize

Problemi s aplikacijom

Analiza korelacije i regresije temelji se na sljedećim pretpostavkama:

  • Promatranja se smatraju neovisnima (petostruki gubitak "orla" ne utječe na rezultat sljedećeg prebacivanja kovanice).
  • U korelacijskoj analizi obje se varijable smatraju slučajnim. U regresiji - samo jedan (ovisan).
  • Prilikom ispitivanja hipoteze mora se promatrati normalna raspodjela. Promjena ovisne varijable trebala bi biti ista za svaku vrijednost na apscisi.
  • Korelacijski dijagram samo je prvi test hipoteze o odnosu između dva niza parametara, a ne i konačni rezultat analize.

primjena korelacijske regresijske analize

Ovisnost i uzročnost

Pretpostavimo da smo izračunali koeficijent korelacije izvoza i BDP-a. Pokazalo se da je jednak modulu jedinstva. Jesmo li napravili korelacijsku i regresijsku analizu do kraja? Naravno da ne. Dobiveni rezultat uopće ne znači da se BDP može izraziti izvozom. Još nismo dokazali uzročno-posljedičnu vezu između pokazatelja. Korelacijsko-regresijska analiza - predviđanje vrijednosti jedne varijable na temelju druge. Međutim, trebate razumjeti da često puno faktora utječe na parametar. Izvoz određuje BDP, ali ne samo on. Postoje i drugi čimbenici. Ovdje postoji povezanost i uzročno-posljedični odnos, iako prilagođen za ostale komponente bruto domaćeg proizvoda.

Druga situacija je puno opasnija. U Velikoj Britaniji je provedeno istraživanje koje je pokazalo da djeca čiji su roditelji pušili češće su prijestupnici. Ovaj zaključak temelji se na snažnoj povezanosti između pokazatelja. Ali je li on točan? Prvo, ovisnost bi mogla biti obrnuta. Roditelji bi mogli početi pušiti zbog stresa zbog činjenice da se njihova djeca neprestano miješaju i krše zakon. Drugo, oba parametra mogu biti posljedica trećeg. Takve obitelji pripadaju niskim društvenim slojevima, koje karakteriziraju oba problema. Stoga se na temelju povezanosti ne može zaključiti da postoji uzročno-posljedična veza.

predviđanje korelacijske regresijske analize

Zašto koristiti regresijsku analizu?

Korelacijska ovisnost uključuje pronalaženje odnosa između količina. Kauzalni odnos u ovom slučaju ostaje iza kulisa. Zadaci korelacijske i regresijske analize podudaraju se samo u smislu potvrđivanja postojanja odnosa između vrijednosti dviju veličina. No, u početku istraživač ne obraća pažnju na mogućnost uzročno-posljedične veze. Regresijska analiza uvijek ima dvije varijable od kojih jedna ovisi. Odvija se u nekoliko faza:

  1. Odabir pravog modela primjenom metode najmanje kvadrata.
  2. Izvođenje jednadžbe koja opisuje učinak promjene neovisne varijable na drugu.

Na primjer, ako proučavamo utjecaj dobi na ljudski rast, tada regresijska analiza može pomoći predvidjeti promjene tijekom godina.

analiza povezanosti poduzeća

Linearna i višestruka regresija

Pretpostavimo da su X i Y dvije povezane varijable. Regresijska analiza omogućuje nam predviđanje veličine jednog od njih na temelju vrijednosti drugog. Na primjer, zrelost i starost su ovisni simptomi. Odnos među njima odražava se linearnom regresijom. U stvari, X možete izraziti Y ili obrnuto. Ali često je samo jedna od regresijskih linija ispravna. Uspjeh analize u velikoj mjeri ovisi o ispravnom određivanju neovisne varijable. Na primjer, imamo dva pokazatelja: prinos i oborine. Iz svakodnevnog iskustva postaje jasno da prvo ovisi o drugom, a ne obrnuto.

Višestruka regresija omogućava izračunavanje nepoznate vrijednosti na temelju vrijednosti tri ili više varijabli. Na primjer, prinos riže po jutru zemlje ovisi o kvaliteti zrna, plodnosti tla, gnojivima, temperaturi i oborinama. Svi ovi parametri utječu na ukupni rezultat. Za pojednostavljenje modela koriste se sljedeće pretpostavke:

  • Odnos između neovisnih i utjecajnih karakteristika je linearan.
  • Multikolinearnost je isključena. To znači da ovisne varijable nisu međusobno povezane.
  • Homoskedastičnost i normalnost niza brojeva.

Korištenje korelacijske i regresijske analize

Postoje tri glavna slučaja upotrebe ove metode:

  1. Ispitivanje povremenih odnosa između količina. U ovom slučaju, istraživač određuje vrijednosti varijable i otkriva utječu li one na promjenu zavisne varijable. Na primjer, možete ljudima davati različite doze alkohola i mjeriti njihov krvni tlak. U ovom slučaju, istraživač sigurno zna da je prvo uzrok drugog, a ne obrnuto. Korelacijsko-regresijska analiza omogućuje vam otkrivanje izravno proporcionalnog linearnog odnosa između ove dvije varijable i dobivanje formule koja je opisuje. U ovom slučaju, vrijednosti izražene u potpuno različitim mjernim jedinicama mogu se usporediti.
  2. Pronalaženje odnosa između dvije varijable bez proširivanja uzročne veze na njih. U ovom slučaju, nema razlike o tome koju veličinu istraživač naziva ovisnom. Štoviše, u stvarnosti se može ispasti da na njih oboje utječe treća varijabla, pa se oni proporcionalno mijenjaju.
  3. Proračun vrijednosti jedne količine na temelju druge. Temelji se na jednadžbi u kojoj su poznati brojevi supstituirani.

Dakle, korelacijska analiza uključuje pronalaženje veze (a ne uzročno) između varijabli, a regresijska analiza objašnjava to, često koristeći matematičku funkciju.


Dodajte komentar
×
×
Jeste li sigurni da želite izbrisati komentar?
izbrisati
×
Razlog za žalbu

posao

Priče o uspjehu

oprema