Poziom istotności w statystyce

Poziom istotności w statystykach jest ważnym wskaźnikiem odzwierciedlającym stopień zaufania do dokładności i prawdziwości otrzymanych (przewidywanych) danych. Pojęcie to jest szeroko stosowane w różnych dziedzinach: od prowadzenia badań socjologicznych do statystycznego testowania hipotez naukowych.

poziom istotności

Definicja

Poziom istotności statystycznej (lub wyniku istotnego statystycznie) pokazuje, jakie jest prawdopodobieństwo przypadkowego wystąpienia badanych wskaźników. Ogólne znaczenie statystyczne tego zjawiska wyraża się wartością współczynnika p (poziom p). W każdym eksperymencie lub obserwacji prawdopodobne jest, że uzyskane dane są spowodowane błędami próbkowania. Dotyczy to zwłaszcza socjologii.

Oznacza to, że statystyki są istotne statystycznie, których prawdopodobieństwo przypadkowego wystąpienia jest wyjątkowo małe lub prowadzi do skrajności. Ekstremalny w tym kontekście jest uważany za stopień odchylenia statystyk od hipotezy zerowej (hipoteza sprawdzana pod kątem zgodności z uzyskanymi danymi próbki). W praktyce naukowej poziom istotności jest wybierany przed zebraniem danych, a jego współczynnik wynosi z reguły 0,05 (5%). W systemach, w których dokładne wartości są niezwykle ważne, wskaźnik ten może wynosić 0,01 (1%) lub mniej.

poziom istotności w statystyce

Tło

Pojęcie poziomu istotności zostało wprowadzone przez brytyjskiego statystykę i genetyka Ronalda Fishera w 1925 r., Kiedy opracował metodologię testowania hipotez statystycznych. Analizując proces, istnieje pewne prawdopodobieństwo pewnych zjawisk. Trudności pojawiają się podczas pracy z małymi (lub nieoczywistymi) procentami prawdopodobieństwa, które mieszczą się w pojęciu „błędu pomiaru”.

Podczas pracy ze statystykami, które nie są wystarczająco szczegółowe, aby zweryfikować, naukowcy stanęli przed problemem hipotezy zerowej, która „zakłóca” małe ilości. Fisher zaproponował zdefiniowanie takich systemów prawdopodobieństwo zdarzeń 5% (0,05) jako wygodny wycinek selektywny, pozwalający odrzucić hipotezę zerową w obliczeniach.

hipoteza statystyczna testująca poziom istotności statystycznej

Wprowadzenie stałego współczynnika

W 1933 r. Naukowcy Jerzy Neumann i Egon Pearson w swoich pracach zalecili z góry (przed zebraniem danych) ustalenie pewnego poziomu znaczenia. Przykłady zastosowania tych zasad są wyraźnie widoczne podczas wyborów. Załóżmy, że są dwaj kandydaci, z których jeden jest bardzo popularny, a drugi jest mało znany. Oczywiście pierwszy kandydat wygrywa wybory, a szanse drugiego kandydata są zerowe. Starają się - ale nie są równe: zawsze istnieje prawdopodobieństwo wystąpienia siły wyższej, sensacyjnych informacji, nieoczekiwanych decyzji, które mogą zmienić przewidywane wyniki wyborów.

Neumann i Pearson zgodzili się, że zaproponowany przez Fishera poziom istotności 0,05 (oznaczony symbolem α) jest najwygodniejszy. Jednak sam Fisher w 1956 r. Sprzeciwił się utrwaleniu tej wartości. Uważał, że poziom α powinien być ustalony zgodnie z określonymi okolicznościami. Na przykład w fizyce cząstek jest to 0,01.

przykłady poziomu istotności

Wartość p

Termin wartość p został po raz pierwszy użyty w pracy Brownleya w 1960 roku. Poziom p (wartość p) jest wskaźnikiem, który jest odwrotnie związany z prawdziwością wyników. Najwyższy współczynnik wartości p odpowiada najniższemu poziomowi ufności w próbce zależności między zmiennymi.

Wartość ta odzwierciedla prawdopodobieństwo błędów związanych z interpretacją wyników. Załóżmy, że poziom p = 0,05 (1/20). Pokazuje pięcioprocentowe prawdopodobieństwo, że związek między zmiennymi znalezionymi w próbce jest tylko losową cechą próbki.Oznacza to, że jeśli ta zależność jest nieobecna, to po powtórzeniu takich eksperymentów średnio w każdym dwudziestym badaniu można oczekiwać takiej samej lub większej zależności między zmiennymi. Często poziom p jest uważany za „dopuszczalny margines” poziomu błędu.

Nawiasem mówiąc, wartość p może nie odzwierciedlać rzeczywistej zależności między zmiennymi, ale pokazuje tylko pewną średnią wartość w ramach założeń. W szczególności ostateczna analiza danych będzie również zależeć od wybranych wartości tego współczynnika. Przy poziomie p = 0,05 pojawią się niektóre wyniki, a przy współczynniku 0,01 inne.

poziom istotności statystycznej

Testowanie hipotez statystycznych

Poziom istotności statystycznej jest szczególnie ważny podczas testowania hipotez. Na przykład podczas obliczania testu dwustronnego obszar odrzucenia jest dzielony równo na obu końcach rozkładu próbki (względem współrzędnej zerowej) i obliczana jest prawda danych.

Załóżmy, że monitorując pewien proces (zjawisko), okazało się, że nowe informacje statystyczne wskazują na niewielkie zmiany w stosunku do poprzednich wartości. Co więcej, rozbieżności w wynikach są niewielkie, nieoczywiste, ale ważne dla badania. Dylemat pojawia się przed specjalistą: czy rzeczywiście zachodzą zmiany, czy te błędy w próbkowaniu (niedokładne pomiary)?

W takim przypadku hipoteza zerowa jest stosowana lub odrzucana (wszystkie przypisywane są błędom lub zmiana w systemie jest uznawana za fakt dokonany). Proces rozwiązania problemu oparty jest na stosunku całkowitej istotności statystycznej (wartość p) i poziomu istotności (α). Jeśli poziom p <α, hipoteza zerowa jest odrzucana. Im mniejsza wartość p, tym bardziej znacząca jest statystyka testowa.

Zastosowane wartości

Poziom istotności zależy od analizowanego materiału. W praktyce stosowane są następujące stałe wartości:

α = 0,1 (lub 10%);
α = 0,05 (lub 5%);
α = 0,01 (lub 1%);
α = 0,001 (lub 0,1%).

Im dokładniejsze są obliczenia, tym niższy jest współczynnik α. Oczywiście prognozy statystyczne w dziedzinie fizyki, chemii, farmacji, genetyki wymagają większej dokładności niż w politologii, socjologii.

koncepcja poziomu istotności

Progi istotne w określonych obszarach

W obszarach o wysokiej precyzji, takich jak fizyka cząstek i działalność produkcyjna, istotność statystyczna jest często wyrażana jako stosunek odchylenia standardowego (oznaczonego współczynnikiem sigma - σ) w stosunku do normalnego rozkładu prawdopodobieństwa (rozkład Gaussa). σ jest wskaźnikiem statystycznym, który określa dyspersję wartości pewnej wartości względem oczekiwań matematycznych. Służy do wykreślania prawdopodobieństwa zdarzeń.

W zależności od dziedziny wiedzy współczynnik σ jest bardzo zróżnicowany. Na przykład podczas przewidywania istnienia bozonu Higgsa parametr σ wynosi pięć (σ = 5), co odpowiada wartości p = 1 / 3,5 miliona. W badaniach genomów poziom istotności może wynosić 5 × 10^-8które nie są rzadkie w tym obszarze.

Skuteczność

Należy pamiętać, że współczynniki α i wartość p nie są dokładnymi cechami. Niezależnie od poziomu istotności w statystyce badanego zjawiska, nie jest to bezwarunkowa podstawa do przyjęcia hipotezy. Na przykład, im mniejsza wartość α, tym większa szansa, że ustalona hipoteza jest znacząca. Istnieje jednak ryzyko błędu, który zmniejsza moc statystyczną (istotność) badania.

Badacze, którzy koncentrują się wyłącznie na statystycznie istotnych wynikach, mogą wyciągać błędne wnioski. Jednocześnie trudno jest dwukrotnie sprawdzić ich pracę, ponieważ używają założeń (które w rzeczywistości są wartościami α i wartości p). Dlatego zawsze zaleca się, wraz z obliczeniem istotności statystycznej, określenie innego wskaźnika - wielkości efektu statystycznego. Wielkość efektu jest ilościową miarą siły efektu.