Nivell de significació en estadístiques

El nivell d’importància de les estadístiques és un indicador important que reflecteix el grau de confiança en la precisió i la veritat de les dades rebudes (previstes). El concepte s’utilitza àmpliament en diversos camps: des de la investigació sociològica, fins a proves estadístiques d’hipòtesis científiques.

nivell de significació

Definició

El nivell de significació estadística (o resultat estadísticament significatiu) mostra quina és la probabilitat que es produeixi accidentalment els indicadors estudiats. La significació estadística general del fenomen s’expressa pel coeficient p-valor (nivell p). En qualsevol experiment o observació, és probable que les dades obtingudes siguin per errors de mostreig. Això és especialment cert per a la sociologia.

És a dir, una estadística és estadísticament significativa la probabilitat que es produeixi accidentalment sigui extremadament petita o tendeix a extrems. Es considera extrem en aquest context el grau de desviació de les estadístiques de la hipòtesi nul·la (hipòtesi que es comprova la coherència amb les dades mostrals obtingudes). A la pràctica científica, el nivell de significació es tria abans de la recollida de dades i, per regla general, el seu coeficient és de 0,05 (5%). Per a sistemes on els valors precisos són extremadament importants, aquest indicador pot ser de 0,01 (1%) o inferior.

nivell d'importància en estadístiques

Antecedents

El concepte de nivell de significació va ser introduït pel estadista i genetista britànic Ronald Fisher el 1925 quan va desenvolupar una metodologia per provar hipòtesis estadístiques. Quan s’analitza un procés, hi ha una certa probabilitat de certs fenòmens. Es presenten dificultats quan es treballa amb petites (o no òbvies) percentatges de probabilitats que entren dins del concepte d '"error de mesurament".

Quan es treballava amb estadístiques prou no específiques per verificar, els científics es van trobar davant el problema de la nul·la hipòtesi, que "interfereix" amb petites quantitats. Fisher va suggerir definir aquests sistemes probabilitat d'esdeveniments 5% (0,05) com una llesca selectiva convenient, que permet rebutjar la hipòtesi nul·la en els càlculs.

hipòtesi estadística comprovant el nivell de significació estadística

La introducció d’un coeficient fix

El 1933, els científics Jerzy Neumann i Egon Pearson en els seus treballs van recomanar amb antelació (abans de la recollida de dades) establir un cert nivell de significació. Exemples d’ús d’aquestes normes són clarament visibles durant les eleccions. Suposem que hi ha dos candidats, un dels quals és molt popular i el segon és poc conegut. Bviament, el primer candidat guanya les eleccions, i les possibilitats del segon tendeixen a zero. S'esforcen, però no són iguals: sempre hi ha la probabilitat de força major, informació sensacional, decisions inesperades que puguin canviar els resultats electorals previstos.

Neumann i Pearson van acordar que el nivell de significació proposat per Fisher de 0,05 (denotat amb el símbol α) és el més convenient. Tot i això, el mateix Fisher el 1956 es va oposar a la fixació d’aquest valor. Creia que el nivell d’α s’hauria d’establir d’acord amb circumstàncies específiques. Per exemple, en física de partícules és 0,01.

exemples de nivell de significació

Valor P

El terme valor p es va utilitzar per primera vegada en els treballs de Brownley el 1960. El nivell P (valor p) és un indicador que està inversament relacionat amb la veritat dels resultats. El valor p de coeficient més alt correspon al nivell més baix de confiança en la mostra de dependència entre les variables.

Aquest valor reflecteix la probabilitat d’errors associats a la interpretació dels resultats. Suposem que estigui al nivell p = 0,05 (1/20). Mostra el cinc per cent de probabilitats que la relació entre les variables que es troben a la mostra sigui només una característica aleatòria de la mostra.És a dir, si aquesta dependència està absent, aleshores amb repetits experiments, de mitjana, en cada vintè estudi, es pot esperar la dependència igual o major entre les variables. Sovint, el nivell p es considera com el "marge acceptable" del nivell d'error.

Per cert, el valor p pot no reflectir la relació real entre les variables, sinó que només mostra un cert valor mitjà en els supòsits. En particular, l’anàlisi final de les dades també dependrà dels valors seleccionats d’aquest coeficient. Amb un nivell p = 0,05, hi haurà uns resultats, i amb un coeficient de 0,01, d’altres.

nivell de significació estadística

Prova d'hipòtesis estadístiques

El nivell de significació estadística és especialment important a l’hora de provar hipòtesis. Per exemple, quan es calcula una prova a dues cares, l’àrea de rebuig es divideix per igual als dos extrems de la distribució de la mostra (en relació a la coordenada zero) i es calcula la veritat de les dades.

Suposem que, en supervisar un determinat procés (fenomen), va resultar que la nova informació estadística indica petits canvis respecte als valors anteriors. A més, les discrepàncies en els resultats són petites, no òbvies, però importants per a l’estudi. El dilema sorgeix davant de l’especialista: realment s’estan produint els canvis o són aquests errors de mostreig (mesures inexactes)?

En aquest cas, s'utilitza o es rebutja la hipòtesi nul·la (tot s'atribueix a un error o es reconeix el canvi del sistema com a fet complpli). El procés de resolució del problema es basa en la relació de significació estadística total (valor p) i nivell de significació (α). Si el nivell p <α, es rebutja la hipòtesi nul·la. Com més petit sigui el valor p, més significativa és l’estadística de prova.

Valors utilitzats

El nivell de significació depèn del material que s’està analitzant. A la pràctica, s’utilitzen els valors fixos següents:

α = 0,1 (o 10%);
α = 0,05 (o 5%);
α = 0,01 (o 1%);
α = 0,001 (o 0,1%).

Com més precisos siguin necessaris els càlculs, menor serà el coeficient α. Naturalment, les previsions estadístiques en física, química, farmàcia i genètica requereixen una precisió més gran que en ciències polítiques, sociologia.

concepte de nivell d’importància

Llindes d’importància en àmbits específics

En àrees d’alta precisió, com la física de partícules i les activitats de fabricació, la importància estadística sovint s’expressa com la relació de la desviació estàndard (denotada pel coeficient sigma - σ) respecte a la distribució de probabilitats normal (distribució gaussiana). σ és un indicador estadístic que determina la dispersió de valors d’un determinat valor en relació a les expectatives matemàtiques. Utilitzat per representar la probabilitat d’esdeveniments.

Segons el camp del coneixement, el coeficient σ varia molt. Per exemple, en predir l'existència del bosó de Higgs, el paràmetre σ és cinc (σ = 5), que correspon al valor p-valor = 1 / 3,5 milions. En estudis sobre genomes, el nivell de significació pot ser 5 × 10.^-8que no són poc freqüents en aquest àmbit.

Efectivitat

Tingueu en compte que els coeficients α i p-valor no són característiques exactes. Sigui quin sigui el nivell de significació de les estadístiques del fenomen estudiat, no és una base incondicional per acceptar la hipòtesi. Per exemple, com més petit sigui el valor de α, més gran és la possibilitat que la hipòtesi establerta sigui significativa. Tot i això, hi ha un risc d’error, que redueix la potència estadística (significació) de l’estudi.

Els investigadors que es centren únicament en resultats estadísticament significatius poden obtenir conclusions errònies. Al mateix temps, és difícil comprovar la seva feina, ja que fan servir supòsits (que, de fet, són els valors de α i de valor p). Per tant, sempre es recomana, juntament amb el càlcul de la importància estadística, determinar un altre indicador: la magnitud de l’efecte estadístic. La magnitud d’un efecte és una mesura quantitativa de la força d’un efecte.