A statisztika a különféle adatok mérésének és elemzésének összetett tudománya. Mint sok más tudományágban, ebben az iparágban létezik a hipotézis fogalma. Így a statisztikai hipotézis olyan helyzet, amelyet el kell fogadni vagy el kell utasítani. Ezen túlmenően ebben az iparágban többféle ilyen feltevés létezik, definíció szerint hasonló, de a gyakorlatban eltérő. A nullhipotézis a mai tanulmány tárgya.
Általánosságtól a konkrétig: hipotézisek a statisztikában
Egy másik, nem kevésbé fontos, eltér a feltételezések alapvető meghatározásától - a statisztikai hipotézis a tudomány számára fontos objektumok általános összességének vizsgálata, amelyről a tudósok következtetéseket vonnak le. Ezt egy mintával (a populáció egy része) lehet ellenőrizni. Íme néhány példa a statisztikai hipotézisekre:
1. A teljes osztály teljesítménye az egyes hallgatók végzettségétől függhet.
2. A matematika kezdeti tanfolyamát egyaránt elsajátítják mind azok a gyermekek, akik 6 éves korukban jöttek az iskolába, mind a 7 éves.
A statisztikákban egy egyszerű hipotézist hívunk ilyen feltételezésnek, amely egyedileg jellemzi a tudós által vett mennyiség bizonyos paraméterét.
A komplex többből vagy végtelen számú egyszerűből áll. Jelöljön meg egy bizonyos területet, vagy nem pontos választ.
Hasznos megérteni a statisztikában a hipotézisek több meghatározását, hogy ne keverjük össze őket a gyakorlatban.
A nullhipotézis fogalma
A nullhipotézis egy olyan elmélet, amely szerint két aggregátum létezik, amelyek nem különböznek egymástól. Tudományos szinten azonban nincs olyan fogalom, hogy a "ne különbözzenek egymástól", hanem "van hasonlóságuk nulla". Ebből a meghatározásból alakult ki a koncepció. A statisztikákban a nullhipotézist H0-nak nevezzük. Ezenkívül a lehetetlen (valószínűtlen) szélső értékét 0,01 - 0,05 vagy annál kevesebbnek tekintik.
Sokkal jobb megérteni, mi a nulla hipotézis, az életből származó példa segít. Az egyetemi tanár azt javasolta, hogy a két csoport hallgatóinak a tesztmunkára való felkészülésének eltérő szintjét jelentéktelen paraméterek, véletlenszerű okok okozzák, amelyek nem befolyásolják az általános iskolai végzettséget (a két hallgatói csoport felkészítésében a különbség nulla).
Érdemes azonban bemutatni egy alternatív hipotézis példáját - egy olyan feltételezést, amely megdönti a nulla elmélet állítását (H1). Például: az egyetemi igazgató javasolta, hogy a két csoport hallgatói számára a tesztmunkára való felkészülés eltérő szintjét a tanárok eltérő tanítási módszerei eredményezzék (a két csoport felkészítése közötti különbség szignifikáns, és ennek magyarázata is van).
Most azonnal láthatja a különbséget a „nulla hipotézis” és az „alternatív hipotézis” fogalma között. Példák szemléltetik ezeket a fogalmakat.
Hipotézis tesztelése
Feltételezés megteremtése a fél probléma. A kezdők számára valódi kihívás a nullhipotézis tesztelése. Sokan számítanak nehézségekre itt.
Az alternatív hipotézis módszerrel, amely állítja a nulla elmélet ellentétét, összehasonlíthatja mindkét lehetőséget, és kiválaszthatja a megfelelőt. A statisztika így működik.
Legyen a H0 nulla hipotézis és a H1 alternatíva, akkor:
H0: c = c0;
H1: c = c0.
Itt c a keresendő populáció egy bizonyos átlagértéke, és c0 a kezdetben megadott érték, amelyhez viszonyítva a hipotézist ellenőrzik. Van egy bizonyos X szám is - a minta átlagértéke, amellyel c0 kerül meghatározásra.
Tehát az ellenőrzés az X és c0 összehasonlításából áll, ha X = c0, akkor a nullhipotézist elfogadjuk. Ha X ≠ c0, akkor feltételezve, hogy az alternatíva igaz.
Megbízható ellenőrzési módszer
A nulla statisztikai hipotézis a gyakorlatban könnyen ellenőrizhető a leghatékonyabb módon. Ez egy értéktartomány felépítését jelenti, akár 95% -os pontossággal.
Először ismernie kell a konfidencia-intervallum kiszámításához szükséges képletet:
X - t * Sx ≤ c ≤ X + t * Sx,
ahol X az eredetileg megadott szám egy alternatív hipotézis alapján;
t - táblázatos értékek (hallgatói együttható);
Sx a standard átlaghiba, amelyet Sx = σ / √n-ként számolnak, ahol a számláló a szórás és az nevező a minta mérete.
Tegyük fel, hogy van a helyzet. Javítás előtt a szállítószalag napi 32,1 kg végterméket állított elő, javítás után a vállalkozó szerint a hatékonyság növekedett, és a szállítószalag heti ellenőrzés szerint átlagosan 39,6 kg-ot kezdett termelni.
A nullhipotézis azzal érvel, hogy a javítások nem befolyásolták a szállítószalag hatékonyságát. Egy alternatív hipotézis szerint a javítás alapvetően megváltoztatta a szállítószalag hatékonyságát, így javult a termelékenysége.
A táblázatból n = 7, t = 2,447, ahol a képlet a következőképpen alakul:
39,6 - 2,477 * 4,2 ≤ s ≤ 39,6 + 2,447 * 4,2;
29,3 ≤ s ≤ 49,9.
Kiderül, hogy a 32.1 érték tartományban van, ezért az alternatíva által javasolt értéket - 39,6 - nem fogadják el automatikusan. Ne feledje, hogy először a nullhipotézis helyességét, majd az ellenkezőjét ellenőrzik.
Az tagadás fajtái
Ezt megelőzően mérlegeltek egy ilyen hipotézis-felépítési lehetőséget, ahol H0 állít valamit, és H1 ezt megcáfolja. Honnan lehetett egy hasonló rendszert összeállítani:
H0: c = c0;
H1: c = c0.
De van még két kapcsolódó módszer a cáfoláshoz. Például a nulla hipotézis szerint egy osztály átlagos osztályozási pontszáma meghaladja a 4,54-et, és az alternatíva azt állítja, hogy ugyanazon osztály átlagértéke kevesebb, mint 4,54. És úgy néz ki, mint egy ilyen rendszer:
H0: s = 4,54;
H1: c <4,54.
Vegye figyelembe, hogy a nullhipotézis szerint az érték nagyobb vagy egyenlő, és a statisztikai szigorúan kevesebb. Nagyon fontos az egyenlőtlenségi jel súlyossága!
Statisztikai ellenőrzés
A nulla hipotézisek statisztikai próbája statisztikai kritérium használata. Az ilyen kritériumokra különféle terjesztési törvények vonatkoznak.
Például van egy F-kritérium, amelyet a Fisher-eloszlás számít. Van egy T-teszt, amelyet a gyakorlatban leggyakrabban használnak, a hallgatói megoszlástól függően. Négyzet alakú kritérium Pearson beleegyezéséhez stb.
A nullhipotézis elfogadásának területe
Az algebrai fogalom a "megengedett értékek régiója". Ez egy olyan szegmens vagy pont az X tengelyen, amelyen sok olyan statisztikai érték található, amelyeknél a nullhipotézis igaz. A szegmens szélső pontjai a kritikus értékek. A szegmens jobb és bal oldalán lévő sugarak kritikus régiók. Ha a talált értéket belefoglalják, akkor a nulla elméletet megcáfolják és alternatívát fogadnak el.
Null hipotézis megdöntése
A statisztikában szereplő nulla hipotézis időnként nagyon szokatlan koncepció. Az ellenőrzés során kétféle hibát okozhat:
1. Az igaz nullhipotézis elutasítása. Az első típust a = 1-nek jelöljük.
2. A hamis nullhipotézis elfogadása. A második típust a = 2 jelöli.
Meg kell érteni, hogy ezek nem ugyanazok a paraméterek, a hibák kimenetele jelentősen eltérhet egymás között, és különböző mintákkal rendelkezhetnek.
Példa a kétféle hibára
A komplex fogalmakat könnyebben lehet kitalálni egy példával.
Egy bizonyos gyógyszer előállítása során a tudósoknak rendkívül óvatosnak kell lenniük, mivel az egyik alkotóelem dózisának túllépése a kész gyógyszer magas szintű toxicitását idézi elő, amelynek következtében az azt szedő betegek meghalhatnak. Kémiai szinten azonban a túladagolás nem észlelhető.
Ezért a gyógyszer forgalomba hozatalát megelőzően kis adagot kell ellenőrizni patkányokon vagy nyulakon úgy, hogy a gyógyszert beadják nekik.Ha az alanyok többsége meghal, akkor a gyógyszert nem szabad forgalomba hozni, ha a kísérleti alanyok élnek, akkor a gyógyszert gyógyszertárakban szabad értékesíteni.
Az első eset: valójában a gyógyszer nem volt mérgező, de a kísérlet során hibát követett el, és a gyógyszert mérgezőként osztályozták, és nem engedték forgalomba. A = 1.
A második eset: egy másik kísérletben, amikor egy másik gyógyszercsomagot ellenőriztek, úgy döntöttek, hogy a gyógyszer nem mérgező, és engedték, hogy forgalomba hozzák, bár valójában a gyógyszer mérgező volt. A = 2.
Az első lehetőség jelentős pénzügyi költségeket von maga után a beszállító-vállalkozó számára, mivel meg kell semmisítenie a gyógyszer teljes tételét, és a semmiből kell kezdenie.
A második helyzet a betegek halálát provokálja, akik ezt a gyógyszert vásárolták és használták.
Valószínűségi elmélet
Nem csak nulla, hanem a statisztikában és a közgazdaságtanban az összes hipotézist megosztják a szignifikancia szintje szerint.
Jelentőségi szint - az első típusú hibák százalékos aránya (a valódi nullhipotézis eltérése).
• az első szint 5% vagy 0,05, azaz a hiba valószínűsége 5-100 vagy 1-20.
• a második szint 1% vagy 0,01, azaz a valószínűsége 1–100.
• a harmadik szint 0,1% vagy 0,001, a valószínűsége 1–1000.
Hipotézis teszt kritériumai
Ha a tudósok már arra a következtetésre jutottak, hogy a nullhipotézis helyes, akkor azt meg kell vizsgálni. Ez szükséges a hiba kiküszöböléséhez. A nullhipotézis tesztelésére alapvető kritérium áll, amely több szakaszból áll:
1. A megengedett hiba valószínűsége P = 0,05.
2. A statisztikákat az 1. kritériumra választják ki.
3. A közismert módszer szerint az elfogadható értékek tartománya.
4. Most a T. statisztika értéke.
5. Ha a T (statisztika) a nullhipotézis elfogadásának területéhez tartozik (mint a „megbízható” módszernél), akkor a feltételezéseket helyesnek tekintjük, ami azt jelenti, hogy maga a nullhipotézis is igaz marad.
A statisztika így működik. A nullhipotézist, megfelelő ellenőrzéssel, elfogadják vagy elutasítják.
Érdemes megjegyezni, hogy a hétköznapi vállalkozók és a felhasználók számára az első három szakasz nagyon nehéz lehet pontosan elvégezni, tehát a profi matematikusok megbíznak benne. De a 4-es és az 5-ös fázist bárki elvégezheti, aki ismeri elegendő statisztikai ellenőrzési módszert.