Statistika je složitá věda o měření a analýze různých dat. Stejně jako v mnoha jiných oborech existuje v tomto odvětví koncept hypotézy. Hypotéza ve statistice je tedy pozice, která musí být přijata nebo odmítnuta. Navíc v tomto odvětví existuje několik typů takových předpokladů, které jsou svým charakterem podobné, ale v praxi se liší. Nulová hypotéza je dnes předmětem studia.
Od obecné k konkrétní: hypotézy ve statistice
Další, neméně důležité, se odchyluje od základní definice předpokladů - statistická hypotéza je studium obecné souhrnu předmětů důležitých pro vědu, ohledně kterých vědci vyvodí závěry. Lze jej zkontrolovat pomocí vzorku (část populace). Zde je několik příkladů statistických hypotéz:
1. Výkon celé třídy může záviset na úrovni vzdělání každého studenta.
2. Počáteční kurz matematiky získávají stejně děti, které přišly do školy ve věku 6 let, a děti, které přišly ve věku 7 let.
Ve statistice je jednoduchá hypotéza nazývána takovým předpokladem, který jedinečně charakterizuje určitý parametr veličiny přijaté vědcem.
Komplex se skládá z několika nebo nekonečného počtu jednoduchých. Uveďte určitou oblast nebo ne přesnou odpověď.
Je užitečné porozumět několika definicím hypotéz ve statistice, aby nedošlo k jejich záměně v praxi.
Koncept nulové hypotézy
Nulová hypotéza je teorie, že existují některé dva agregáty, které se navzájem neliší. Na vědecké úrovni však neexistuje pojem „neliší se“, ale existuje „jejich podobnost je nulová“. Z této definice byl vytvořen koncept. Ve statistice je nulová hypotéza označena jako H0. Mimoto je extrémní hodnota nemožného (nepravděpodobného) považována za 0,01 až 0,05 nebo méně.
Je lepší pochopit, co je nulová hypotéza, pomůže vám příklad ze života. Učitel univerzity navrhl, že různá úroveň přípravy studentů obou skupin na testovací práci je způsobena nevýznamnými parametry, náhodnými důvody, které neovlivňují obecnou úroveň vzdělávání (rozdíl v přípravě dvou skupin studentů je nulový).
Je však užitečné uvést příklad alternativní hypotézy - předpoklad, který vyvrací tvrzení nulové teorie (H1). Například: ředitel univerzity navrhl, že různá úroveň přípravy na testovací práci pro studenty obou skupin je způsobena použitím různých vyučovacích metod učiteli (rozdíl v přípravě obou skupin je významný a existuje vysvětlení).
Nyní můžete okamžitě vidět rozdíl mezi pojmy „nulová hypotéza“ a „alternativní hypotéza“. Tyto pojmy ilustrují příklady.
Testování hypotéz
Vytvořit předpoklad je poloviční problém. Skutečnou výzvou pro začátečníky je testování nulové hypotézy. Právě zde mnozí očekávají potíže.
Pomocí metody alternativní hypotézy, která tvrdí opak opaku teorie nuly, můžete porovnat obě možnosti a vybrat tu správnou. Takto statistika funguje.
Nechte nulovou hypotézu H0 a alternativní H1:
H0: c = CO;
H1: c ≠ c0.
Zde c je určitá průměrná hodnota populace, která má být nalezena, a c0 je původně daná hodnota, ve vztahu ke které je ověřována hypotéza. Existuje také určité číslo X - průměrná hodnota vzorku, která určuje c0.
Kontrola tedy spočívá ve srovnání X a c0, pokud X = c0, pak je akceptována nulová hypotéza. Pokud X ≠ c0, pak se předpokládá, že alternativa je považována za pravdivou.
Důvěryhodná metoda ověření
Existuje nejúčinnější způsob, jak lze nulovou statistickou hypotézu v praxi snadno ověřit. Spočívá v budování rozsahu hodnot až do 95% přesnosti.
Nejprve musíte znát vzorec pro výpočet intervalu spolehlivosti:
X - t * Sx ≤ c ≤ X + t * Sx,
kde X je původně dané číslo na základě alternativní hypotézy;
t - tabulkové hodnoty (studentský koeficient);
Sx je standardní průměrná chyba, která se počítá jako Sx = σ / √n, kde čitatel je standardní odchylka a jmenovatel je velikost vzorku.
Předpokládejme tedy situaci. Před opravou dopravník denně vyrobil 32,1 kg finálních produktů a po opravě se podle podnikatele zvýšila efektivita a dopravník podle týdenní kontroly začal v průměru vyrábět 39,6 kg.
Nulová hypotéza bude argumentovat, že opravy neovlivnily účinnost dopravníku. Alternativní hypotéza řekne, že oprava zásadně změnila účinnost dopravníku, takže se zvýšila jeho produktivita.
Z tabulky najdeme n = 7, t = 2 447, ze kterého bude mít vzorec následující tvar:
39,6 - 2,447 * 4,2 ≤ s ≤ 39,6 + 2,477 * 4,2;
29,3 ≤ s ≤ 49,9.
Ukazuje se, že hodnota 32.1 je v rozsahu, a proto hodnota navrhovaná alternativou - 39,6 - není automaticky akceptována. Nezapomeňte, že nulová hypotéza je nejprve zkontrolována z hlediska správnosti a poté opaku.
Odrůdy odmítnutí
Předtím byla zvažována taková možnost konstrukce hypotézy, kde H0 něco tvrdí, a H1 to vyvrací. Odkud bylo možné vytvořit podobný systém:
H0: c = CO;
H1: c ≠ c0.
Existují však i další související metody vyvracení. Například nulová hypotéza uvádí, že průměrné hodnocení třídy je více než 4,54 a alternativa pak řekne, že průměrné hodnocení třídy je nižší než 4,54. A bude to vypadat jako systém jako je tento:
H0: s = 4,54;
H1: c <4,54.
Všimněte si, že nulová hypotéza uvádí, že hodnota je větší nebo rovná a statistická je přísně menší. Závažnost znamení nerovnosti je velmi důležitá!
Statistické ověření
Statistickým testem nulových hypotéz je použití statistického kritéria. Tato kritéria podléhají různým zákonům o distribuci.
Například existuje F-kritérium, které se vypočítá podle Fisherovy distribuce. Existuje T-test, nejčastěji používaný v praxi, v závislosti na distribuci studentů. Čtvercové kritérium pro Pearsonův souhlas atd.
Oblast přijetí nulové hypotézy
V algebře existuje pojem „oblast přípustných hodnot“. Toto je takový segment nebo bod na ose X, na kterém existuje mnoho statistických hodnot, ve kterých je neplatná hypotéza pravdivá. Extrémní body segmentu jsou kritické hodnoty. Paprsky na pravé a levé straně segmentu jsou kritické oblasti. Pokud je v nich nalezená hodnota zahrnuta, pak je teorie nuly vyvrácena a je přijata alternativa.
Nulová hypotéza vyvrácena
Nulová hypotéza ve statistice je občas velmi riskantní koncept. Během ověřování může provést dva typy chyb:
1. Odmítnutí skutečné nulové hypotézy. První typ označujeme jako a = 1.
2. Přijetí falešné nulové hypotézy. Druhý typ se označuje jako a = 2.
Mělo by být zřejmé, že se nejedná o stejné parametry, výsledky chyb se mohou mezi sebou významně lišit a mít různé vzorky.
Příklad dvou typů chyb
S komplexním konceptem je snazší přijít na příkladu.
Při výrobě určitého léčiva potřebují vědci mimořádnou opatrnost, protože překročení dávky jedné ze složek vyvolává vysokou úroveň toxicity hotového léčiva, na které mohou zemřít pacienti, kteří jej užívají. Na chemické úrovni však nelze předávkování detekovat.
Z tohoto důvodu se před uvolněním léčiva na prodej provede malá dávka u potkanů nebo králíků podáním léku.Pokud většina subjektů zemře, pak není povolen prodej léku, pokud jsou experimentální jedinci naživu, je povoleno prodávat lék v lékárnách.
První případ: ve skutečnosti nebyl tento lék toxický, ale během experimentu došlo k chybě a lék byl klasifikován jako toxický a nebyl povolen k prodeji. A = 1.
Druhý případ: v jiném experimentu, při kontrole další šarže medicíny, bylo rozhodnuto, že droga není toxická, a bylo povoleno jít do prodeje, i když ve skutečnosti byla droga jedovatá. A = 2.
První možnost bude pro dodavatele-podnikatele znamenat vysoké finanční náklady, protože musíte zničit celou dávku léku a začít od nuly.
Druhá situace vyvolá smrt pacientů, kteří tento lék zakoupili a použili.
Teorie pravděpodobnosti
Nejen nula, ale všechny hypotézy ve statistice a ekonomii jsou děleny úrovní významnosti.
Úroveň významnosti - procento chyb prvního druhu (odchylka od skutečné nulové hypotézy).
• první úroveň je 5% nebo 0,05, to znamená, že pravděpodobnost chyby je 5 až 100 nebo 1 až 20.
• druhá úroveň je 1% nebo 0,01, to znamená, že pravděpodobnost je 1 až 100.
• třetí úroveň je 0,1% nebo 0,001, pravděpodobnost je 1 až 1000.
Kritéria testu hypotéz
Pokud vědci již dospěli k závěru, že nulová hypotéza je správná, musí být otestována. To je nutné k odstranění chyby. Existuje základní kritérium pro testování nulové hypotézy, sestávající z několika fází:
1. Zjišťuje se přípustná pravděpodobnost chyby P = 0,05.
2. Statistiky jsou vybírány pro kritérium 1.
3. Známou metodou je rozmezí přijatelných hodnot.
4. Nyní hodnota statistiky T.
5. Pokud T (statistika) patří do oblasti přijímání nulové hypotézy (jako v metodě „trusting“), jsou předpoklady považovány za správné, což znamená, že nulová hypotéza sama o sobě zůstává pravdivá.
Takto statistika funguje. Nulová hypotéza s řádným ověřením bude přijata nebo zamítnuta.
Stojí za povšimnutí, že pro běžné podnikatele a uživatele mohou být první tři fáze velmi obtížné, pokud jde o přesné provedení, takže jim důvěřují profesionální matematici. Ale 4 a 5 fází může provádět kdokoli, kdo zná dostatek statistických metod ověření.