kategórie
...

Úroveň významnosti v štatistike

Úroveň významnosti v štatistike je dôležitým ukazovateľom odrážajúcim stupeň dôvery v presnosť a pravdivosť prijatých (predpokladaných) údajov. Tento koncept sa široko používa v rôznych oblastiach: od vykonávania sociologického výskumu až po štatistické testovanie vedeckých hypotéz.

úroveň významnosti

definícia

Úroveň štatistickej významnosti (alebo štatisticky významného výsledku) ukazuje, aká je pravdepodobnosť náhodného výskytu sledovaných ukazovateľov. Všeobecná štatistická významnosť tohto javu je vyjadrená koeficientom p-hodnoty (p-úroveň). Pri každom experimente alebo pozorovaní je pravdepodobné, že získané údaje sú spôsobené chybami pri odbere vzoriek. To platí najmä pre sociológiu.

To znamená, že štatistika je štatisticky významná, ktorej pravdepodobnosť náhodného výskytu je extrémne nízka alebo má sklon k extrémom. Za extrémny v tejto súvislosti sa považuje stupeň odchýlky štatistiky od nulovej hypotézy (hypotéza, ktorá sa kontroluje z hľadiska konzistentnosti so získanými údajmi zo vzorky). Vo vedeckej praxi sa úroveň významnosti vyberá pred zberom údajov a spravidla je jej koeficient 0,05 (5%). V prípade systémov, v ktorých sú mimoriadne dôležité presné hodnoty, môže byť tento ukazovateľ 0,01 (1%) alebo menej.

úroveň významnosti v štatistike

anamnéza

Koncept významnosti predstavil britský štatistik a genetik Ronald Fisher v roku 1925, keď vyvinul metodiku testovania štatistických hypotéz. Pri analýze procesu existuje určitá pravdepodobnosť určitých javov. Ťažkosti vznikajú pri práci s malými (alebo nie zrejmými) percentuálnymi pravdepodobnosťami, ktoré spadajú pod pojem „chyba merania“.

Pri práci so štatistikami, ktoré nie sú dostatočne konkrétne na to, aby sa dali overiť, čelili vedci problému nulovej hypotézy, ktorá „zasahuje“ do malých množstiev. Fisher navrhol definovať takéto systémy pravdepodobnosť udalostí 5% (0,05) ako vhodný selektívny rez, ktorý vám umožňuje odmietnuť nulovú hypotézu vo výpočtoch.

štatistická hypotéza testujúca úroveň štatistickej významnosti

Zavedenie pevného koeficientu

V roku 1933 vedci Jerzy Neumann a Egon Pearson vo svojich prácach odporúčali vopred (pred zberom údajov) stanoviť určitú úroveň významu. Príklady použitia týchto pravidiel sú jasne viditeľné počas volieb. Predpokladajme, že existujú dvaja kandidáti, z ktorých jeden je veľmi populárny a druhý je málo známy. Je zrejmé, že prvý kandidát vyhrá voľby a šance druhého majú sklon k nule. Usilujú sa - ale nie rovnaké: vždy existuje pravdepodobnosť vyššej moci, senzačné informácie, neočakávané rozhodnutia, ktoré môžu zmeniť predpokladané výsledky volieb.

Neumann a Pearson sa zhodli na tom, že najvýhodnejšia je Fisherova navrhovaná hladina významnosti 0,05 (označená symbolom a). Sám Fisher sa však v roku 1956 postavil proti fixácii tejto hodnoty. Veril, že hladina α by sa mala stanoviť v súlade s konkrétnymi okolnosťami. Napríklad vo fyzike častíc je to 0,01.

príklady úrovne významnosti

hladine významnosti p-

Termín p-hodnota bol prvýkrát použitý v práci Brownleyho v roku 1960. Úroveň P (hodnota p) je ukazovateľ, ktorý nepriamo súvisí s pravdivosťou výsledkov. Najvyššia hodnota koeficientu p zodpovedá najnižšej úrovni spoľahlivosti vo vzorke závislosti medzi premennými.

Táto hodnota odráža pravdepodobnosť chýb spojených s interpretáciou výsledkov. Predpokladajme, že p-úroveň = 0,05 (1/20). Ukazuje päťpercentnú pravdepodobnosť, že vzťah medzi premennými nájdenými vo vzorke je iba náhodný znak vzorky.To znamená, že ak táto závislosť chýba, potom pri opakovaných takýchto experimentoch možno v priemere v každej dvadsiatej štúdii očakávať rovnakú alebo väčšiu závislosť medzi premennými. Úroveň p sa často považuje za „prijateľnú hranicu“ úrovne chyby.

Mimochodom, p-hodnota nemusí odrážať skutočný vzťah medzi premennými, ale iba ukazuje určitú priemernú hodnotu v rámci predpokladov. Konečná analýza údajov bude predovšetkým závisieť od zvolených hodnôt tohto koeficientu. Pri p-hladine = 0,05 sa dosiahnu niektoré výsledky as koeficientom 0,01 ďalšie.

úroveň štatistickej významnosti

Testovanie štatistických hypotéz

Úroveň štatistickej významnosti je obzvlášť dôležitá pri testovaní hypotéz. Napríklad pri výpočte obojstranného testu sa oblasť odmietnutia rozdelí rovnomerne na obidva konce distribúcie vzorky (vzhľadom na nulovú súradnicu) a vypočíta sa pravda údajov.

Predpokladajme, že pri monitorovaní určitého procesu (javu) sa ukázalo, že nové štatistické informácie naznačujú malé zmeny v porovnaní s predchádzajúcimi hodnotami. Navyše rozdiely vo výsledkoch sú malé, nie očividné, ale dôležité pre štúdiu. Dilema vzniká pred špecialistom: prebiehajú skutočne zmeny alebo sa vyskytujú tieto chyby vzorkovania (nepresné merania)?

V tomto prípade je použitá alebo zamietnutá nulová hypotéza (všetko je priradené chybe alebo zmena v systéme je rozpoznaná ako hotová vec). Proces riešenia problému je založený na pomere celkovej štatistickej významnosti (p-hodnota) a úrovne významnosti (α). Ak je p-hladina

Použité hodnoty

Úroveň významnosti závisí od analyzovaného materiálu. V praxi sa používajú tieto pevné hodnoty:

  • a = 0,1 (alebo 10%);
  • a = 0,05 (alebo 5%);
  • a = 0,01 (alebo 1%);
  • a = 0,001 (alebo 0,1%).

Čím presnejšie sú výpočty potrebné, tým nižší je koeficient α. Štatistické prognózy vo fyzike, chémii, farmácii, genetike si, samozrejme, vyžadujú väčšiu presnosť ako v politológii, sociológii.

koncept úrovne významnosti

Prahové hodnoty relevantnosti v konkrétnych oblastiach

Vo vysoko presných oblastiach, ako je fyzika častíc a výrobné činnosti, sa štatistická významnosť často vyjadruje ako pomer štandardnej odchýlky (označený koeficientom sigma - σ) k normálnemu rozdeleniu pravdepodobnosti (gaussovské rozdelenie). σ je štatistický ukazovateľ, ktorý určuje rozptyl hodnôt určitej hodnoty vzhľadom na matematické očakávania. Používa sa na vykreslenie pravdepodobnosti udalostí.

V závislosti od oblasti poznania sa koeficient σ veľmi líši. Napríklad pri predpovedaní existencie Higgsovho bozónu je parameter σ päť (σ = 5), čo zodpovedá hodnote p-hodnota = 1 / 3,5 milióna. V štúdiách genómov môže byť hladina významnosti 5 × 10-8ktoré nie sú pre túto oblasť neobvyklé.

účinnosť

Majte na pamäti, že koeficienty α a p nie sú presné charakteristiky. Bez ohľadu na úroveň významnosti v štatistike skúmaného fenoménu to nie je bezpodmienečný základ pre akceptovanie hypotézy. Napríklad čím menšia je hodnota a, tým väčšia je pravdepodobnosť, že zavedená hypotéza je významná. Existuje však riziko chyby, ktorá znižuje štatistickú silu (významnosť) štúdie.

Vedci, ktorí sa zameriavajú výlučne na štatisticky významné výsledky, môžu dospieť k nesprávnym záverom. Zároveň je ťažké skontrolovať ich prácu, pretože využívajú predpoklady (ktoré sú v skutočnosti hodnoty α a p-hodnoty). Preto sa spolu s výpočtom štatistickej významnosti vždy odporúča určiť ďalší ukazovateľ - rozsah štatistického účinku. Rozsah účinku je kvantitatívne meranie sily účinku.


Pridajte komentár
×
×
Naozaj chcete odstrániť komentár?
vymazať
×
Dôvod sťažnosti

obchodné

Príbehy o úspechu

zariadenie