Rúbriques
...

Anàlisi de correlació i regressió: exemple, tasques, aplicació. Mètode de correlació i anàlisi de regressió

Anàlisi de regressió de correlació - Aquest és un dels mètodes més habituals per estudiar la relació entre valors numèrics. El seu objectiu principal és trobar la relació entre els dos paràmetres i el seu grau amb la derivació posterior de l’equació. Per exemple, tenim estudiants que han superat l’examen de matemàtiques i anglès. Podem utilitzar correlació per determinar si l’èxit d’una prova afecta els resultats en un altre tema. Pel que fa a l’anàlisi de regressió, ajuda a predir les notes de matemàtiques en funció dels punts obtinguts en un examen d’anglès i viceversa.

anàlisi de regressió de correlació

Què és un gràfic de correlació?

Qualsevol anàlisi comença amb la recollida d’informació. Com més és, més precisa serà el resultat obtingut al final. A l’exemple anterior, tenim dues disciplines en què els estudiants han de passar un examen. La seva taxa d’èxit és una estimació. L’anàlisi de correlació-regressió mostra si el resultat d’una assignatura afecta els punts obtinguts al segon examen. Per respondre a aquesta pregunta, cal analitzar en paral·lel les valoracions de tots els estudiants. Però primer cal decidir la variable depenent. En aquest cas, no és tan important. Suposem que un examen de matemàtiques va tenir lloc abans. Els punts que hi ha són una variable independent (es posposen al llarg de l’abscisa). L'anglès està programat més tard. Per tant, les estimacions basades en ella són una variable dependent (es representen al llarg de l’ordenada). Com més gràfic s’obtingui així s’assembla a una recta, més forta serà la correlació lineal entre els dos valors seleccionats. Això significa que els estudiants de matemàtiques tenen més probabilitats de trobar cinquanta a l'examen d'anglès.

Suposicions i simplificacions

El mètode de correlació i anàlisi de regressió consisteix a trobar una relació causal. Tanmateix, a la primera etapa, heu d’entendre que els canvis en ambdues quantitats poden ser deguts a algun terç, encara no considerat per l’investigador. També hi pot haver relacions no lineals entre les variables, per tant, l'obtenció d'un coeficient igual a zero no és el final de l'experiment.

exemple d’anàlisi de regressió de correlació

Correlació lineal de Pearson

Aquest coeficient es pot utilitzar subjecte a dues condicions. El primer - tots els valors de les variables són nombres racionals, el segon - s'espera que els valors canviïn proporcionalment. Aquest coeficient és sempre entre -1 i 1. Si és superior a zero, hi ha una dependència directament proporcional, menys –inversament, igual–, aquests valors no s’afecten de cap manera. La capacitat de calcular aquest indicador és la base de l’anàlisi de correlació i regressió. Per primera vegada, aquest coeficient va ser desenvolupat per Karl Pearson basat en la idea de Francis Galton.

Propietats i precaucions

El coeficient de correlació de Pearson és una eina potent, però també s’ha d’utilitzar amb precaució. S’utilitzen els advertiments següents:

  1. El coeficient Pearson indica la presència o l'absència d'una relació lineal. L’anàlisi de correlació-regressió no s’acaba aquí, però pot resultar que les variables estan tan interconnectades.
  2. Cal tenir cura d’interpretar el valor del coeficient. Es pot trobar una correlació entre la mida de la cama i el nivell d’IQ.Però això no significa que un indicador en determini un altre.
  3. El coeficient Pearson no diu res sobre la relació causal entre els indicadors.

mètode d’anàlisi de regressió de correlació

Coeficient de correlació de rang de Spearman

Si un canvi en el valor d’un indicador condueix a un augment o disminució del valor d’un altre, això vol dir que estan relacionats. L’anàlisi de correlació-regressió, un exemple que es donarà a continuació, està connectat amb precisió amb aquests paràmetres. El coeficient de rang permet simplificar els càlculs.

Anàlisi de correlació i regressió: un exemple

Suposem que hi ha una avaluació del rendiment de deu empreses. Tenim dos jutges que els donen punts. L'anàlisi de correlació i regressió de l'empresa en aquest cas no es pot realitzar a partir del coeficient lineal Pearson. No ens interessa la relació entre la qualificació dels jutges. Els rengles de les empreses segons els jutges són importants.

Aquest tipus d’anàlisi presenta els avantatges següents:

  • Forma no paramètrica de relacions entre les quantitats estudiades.
  • Facilitat d’ús, ja que es poden atribuir les files tant en ordre ascendent de valor com en ordre descendent.

L’únic requisit d’aquest tipus d’anàlisi és la necessitat de convertir les dades d’origen.

bàsics de l’anàlisi de regressió de correlació

Problemes d’aplicació

L'anàlisi de correlació i regressió es basa en els següents supòsits:

  • Les observacions es consideren independents (una pèrdua de cinc vegades de l’àguila no afecta el resultat del següent viratge).
  • En l'anàlisi de correlació, ambdues variables es consideren aleatòries. En regressió: només un (dependent).
  • Quan es prova una hipòtesi, cal observar una distribució normal. El canvi de la variable depenent hauria de ser el mateix per a cada valor de l’abscisa.
  • El diagrama de correlació és només el primer test de la hipòtesi sobre la relació entre les dues sèries de paràmetres i no el resultat final de l’anàlisi.

aplicació de l'anàlisi de regressió de correlació

Dependència i causalitat

Suposem que hem calculat el coeficient de correlació del volum d’exportació i del PIB. Va resultar ser igual a unitat modulo. Hem realitzat anàlisis de correlació i regressió fins al final? Per descomptat que no. El resultat obtingut no significa en absolut que el PIB es pugui expressar mitjançant l'exportació. Encara no hem demostrat una relació de causalitat entre els indicadors. Anàlisi de correlació-regressió: predicció dels valors d’una variable en funció d’una altra. Tanmateix, heu d’entendre que sovint molts factors afecten el paràmetre. L’exportació determina el PIB, però no només. Hi ha altres factors. Aquí hi ha una correlació i una relació causal, encara que s’ajusten per a altres components del producte interior brut.

Una altra situació és molt més perillosa. Al Regne Unit, es va realitzar una enquesta que va demostrar que els nens que els seus pares fumaven eren més sovint infractors. Aquesta conclusió es basa en una forta correlació entre l’indicador. Però és correcte? En primer lloc, la dependència podria ser inversa. Els pares podrien començar a fumar a causa de l’estrès pel fet que els seus fills constantment es veuen alterats i incomplien la llei. En segon lloc, tots dos paràmetres poden ser deguts al tercer. Aquestes famílies pertanyen a classes socials baixes, que es caracteritzen per tots dos problemes. Per tant, a partir de la correlació, no es pot concloure que hi hagi una relació causal.

anàlisi de regressió de correlació de previsió

Per què fer servir l’anàlisi de regressió?

La correlació depèn de trobar relacions entre quantitats. La relació de causalitat en aquest cas roman entre els escenaris. Les tasques de correlació i anàlisi de regressió coincideixen només en termes de confirmar l’existència d’una relació entre els valors de dues quantitats. Tot i això, inicialment l'investigador no presta atenció a la possibilitat d'una relació causal. L’anàlisi de regressió sempre té dues variables, una de les quals depèn. Té lloc en diverses etapes:

  1. Elecció del model adequat mitjançant el mètode de menys quadrats.
  2. Derivació d’una equació que descriu l’efecte d’un canvi d’una variable independent sobre una altra.

Per exemple, si estudiem l'efecte de l'edat en el creixement humà, una anàlisi de regressió pot ajudar a predir canvis al llarg dels anys.

anàlisi de correlació empresarial

Regressió lineal i múltiple

Suposem que X i Y són dues variables relacionades. L’anàlisi de regressió ens permet predir la magnitud d’un d’ells en funció dels valors de l’altre. Per exemple, la maduresa i l’edat són símptomes dependents. La relació entre ells es reflecteix mitjançant la regressió lineal. De fet, podeu expressar X a través de Y o viceversa. Però sovint només una de les línies de regressió és correcta. L’èxit de l’anàlisi depèn en gran mesura de la correcta determinació de la variable independent. Per exemple, tenim dos indicadors: el rendiment i la precipitació. De l’experiència quotidiana, queda clar que la primera depèn de la segona, i no a l’inrevés.

La regressió múltiple permet calcular un valor desconegut en funció dels valors de tres o més variables. Per exemple, el rendiment d’arròs per acre de terra depèn de la qualitat del gra, la fertilitat del sòl, els fertilitzants, la temperatura i les precipitacions. Tots aquests paràmetres afecten el resultat global. Per simplificar el model, s’utilitzen els següents supòsits:

  • La relació entre característiques independents i influents és lineal.
  • La multicollinearitat està exclosa. Això vol dir que les variables dependents no estan interconnectades.
  • Homoskedasticitat i normalitat de sèries de números.

L’ús de l’anàlisi de correlació i regressió

Hi ha tres casos principals en l'ús d'aquest mètode:

  1. Prova de relacions casuals entre quantitats. En aquest cas, l'investigador determina els valors de la variable i esbrina si afecten el canvi de la variable dependent. Per exemple, podeu proporcionar a les persones diferents dosis d’alcohol i mesurar la seva pressió arterial. En aquest cas, l’investigador sap amb certesa que la primera és la causa del segon, i no a l’inrevés. L’anàlisi de correlació-regressió permet detectar una relació lineal directament proporcional entre aquestes dues variables i obtenir una fórmula que la descrigui. En aquest cas, es poden comparar valors expressats en unitats de mesura completament diferents.
  2. Trobar una relació entre dues variables sense estendre cap relació causal. En aquest cas, no hi ha diferència de la mida que l'investigador anomeni dependent. A més, en realitat, pot resultar que tots dos estan afectats per la tercera variable, per tant canvien proporcionalment.
  3. Càlcul dels valors d’una quantitat en funció d’una altra. Es basa en una equació en què se substitueixen els nombres coneguts.

Així, l'anàlisi de correlació implica trobar una connexió (no causal) entre variables, i l'anàlisi de regressió ho explica, sovint utilitzant una funció matemàtica.


Afegeix un comentari
×
×
Esteu segur que voleu eliminar el comentari?
Suprimeix
×
Motiu de la queixa

Empreses

Històries d’èxit

Equipament