Statistik ist eine komplexe Wissenschaft des Messens und Analysierens verschiedener Daten. Wie in vielen anderen Disziplinen existiert in dieser Branche das Konzept einer Hypothese. Eine Hypothese in der Statistik ist also eine Position, die akzeptiert oder abgelehnt werden muss. Darüber hinaus gibt es in dieser Branche verschiedene Arten solcher Annahmen, die per Definition ähnlich, in der Praxis jedoch unterschiedlich sind. Die Nullhypothese ist heute Gegenstand des Studiums.
Von allgemein bis speziell: Hypothesen in der Statistik
Eine andere, nicht minder wichtige Abweichung von der Grunddefinition der Annahmen - die statistische Hypothese ist die Untersuchung der allgemeinen Gesamtheit der für die Wissenschaft wichtigen Objekte, woraus die Wissenschaftler Schlüsse ziehen. Sie kann anhand einer Stichprobe (Teil der Bevölkerung) überprüft werden. Hier einige Beispiele für statistische Hypothesen:
1. Die Leistung der gesamten Klasse kann vom Bildungsstand jedes Schülers abhängen.
2. Der Grundkurs in Mathematik wird gleichermaßen von Kindern im Alter von 6 Jahren und von Kindern im Alter von 7 Jahren belegt.
In der Statistik nennt man eine einfache Hypothese eine solche Annahme, die einen bestimmten Parameter einer von einem Wissenschaftler genommenen Größe eindeutig charakterisiert.
Komplex besteht aus mehreren oder einer unendlichen Anzahl von einfachen. Geben Sie einen bestimmten Bereich an oder geben Sie keine genaue Antwort.
Es ist nützlich, mehrere Definitionen von Hypothesen in der Statistik zu verstehen, um sie in der Praxis nicht zu verwechseln.
Das Konzept der Nullhypothese
Die Nullhypothese ist eine Theorie, dass es zwei Aggregate gibt, die sich nicht voneinander unterscheiden. Auf wissenschaftlicher Ebene gibt es jedoch kein Konzept von "Nicht unterscheiden", sondern "Ihre Ähnlichkeit ist Null". Aus dieser Definition wurde das Konzept gebildet. In der Statistik wird die Nullhypothese als H0 bezeichnet. Darüber hinaus wird angenommen, dass der Extremwert des Unmöglichen (unwahrscheinlich) 0,01 bis 0,05 oder weniger beträgt.
Es ist besser zu verstehen, was die Nullhypothese ist, ein Beispiel aus dem Leben wird helfen. Der Hochschullehrer schlug vor, dass der unterschiedliche Vorbereitungsgrad der Schüler der beiden Gruppen für die Testarbeit durch unbedeutende Parameter verursacht wird, zufällige Gründe, die das allgemeine Bildungsniveau nicht beeinflussen (der Unterschied bei der Vorbereitung von zwei Schülergruppen beträgt null).
Es lohnt sich jedoch, ein Beispiel für eine alternative Hypothese zu nennen - eine Annahme, die die Behauptung der Null-Theorie (H1) widerlegt. Zum Beispiel: Der Direktor der Universität schlug vor, dass das unterschiedliche Niveau bei der Vorbereitung der Testarbeit für die Schüler der beiden Gruppen durch die Verwendung unterschiedlicher Lehrmethoden durch die Lehrer verursacht wird (der Unterschied bei der Vorbereitung der beiden Gruppen ist erheblich und es gibt eine Erklärung).
Jetzt können Sie sofort den Unterschied zwischen den Begriffen „Nullhypothese“ und „Alternativhypothese“ erkennen. Beispiele veranschaulichen diese Konzepte.
Hypothesentest
Eine Annahme zu erstellen ist die halbe Mühe. Eine echte Herausforderung für Anfänger ist das Testen der Nullhypothese. Hier erwarten viele Schwierigkeiten.
Mit der alternativen Hypothesenmethode, die das Gegenteil der Null-Theorie behauptet, können Sie beide Optionen vergleichen und die richtige auswählen. So funktionieren Statistiken.
Lassen Sie die Nullhypothese H0 und die Alternative H1 dann:
H0: c = c0;
H1: c ≠ c0.
Dabei ist c ein bestimmter Mittelwert der zu findenden Grundgesamtheit und c0 ist zunächst der gegebene Wert, anhand dessen die Hypothese überprüft wird. Es gibt auch eine bestimmte Zahl X - der Durchschnittswert der Stichprobe, mit der c0 bestimmt wird.
Die Prüfung besteht also darin, X und c0 zu vergleichen. Wenn X = c0, wird die Nullhypothese akzeptiert. Wenn X ≤ c0 ist, wird die Alternative unter der Annahme als wahr betrachtet.
Vertrauenswürdige Überprüfungsmethode
Es gibt den effektivsten Weg, mit dem die statistische Nullhypothese in der Praxis leicht verifiziert werden kann. Es besteht darin, einen Wertebereich mit einer Genauigkeit von bis zu 95% zu erstellen.
Zunächst müssen Sie die Formel zur Berechnung des Konfidenzintervalls kennen:
X - t * Sx ≤ c ≤ X + t * Sx,
wobei X die ursprünglich gegebene Zahl ist, basierend auf einer alternativen Hypothese;
t - Tabellenwerte (Studentenkoeffizient);
Sx ist der durchschnittliche Standardfehler, der berechnet wird als Sx = σ / √n, wobei der Zähler die Standardabweichung und der Nenner die Stichprobengröße ist.
Nehmen wir also die Situation an. Vor der Reparatur produzierte der Förderer 32,1 kg Endprodukte pro Tag, und nach der Reparatur erhöhte sich nach Angaben des Unternehmers die Effizienz, und der Förderer produzierte nach einer wöchentlichen Überprüfung durchschnittlich 39,6 kg.
Die Nullhypothese besagt, dass Reparaturen die Effizienz des Förderers nicht beeinträchtigten. Eine alternative Hypothese besagt, dass die Reparatur die Effizienz des Förderers grundlegend verändert hat, sodass sich seine Produktivität verbessert hat.
Aus der Tabelle ergibt sich n = 7, t = 2.447, woraus die Formel die folgende Form annimmt:
39,6 - 2,447 * 4,2 ≤ s ≤ 39,6 + 2,477 * 4,2;
29,3 ≤ s ≤ 49,9.
Es stellt sich heraus, dass der Wert 32,1 im Bereich liegt und daher der von der Alternative vorgeschlagene Wert - 39,6 - nicht automatisch akzeptiert wird. Denken Sie daran, dass die Nullhypothese zuerst auf ihre Richtigkeit und dann auf das Gegenteil überprüft wird.
Sorten der Ablehnung
Zuvor wurde eine solche Hypothesenkonstruktionsoption in Betracht gezogen, bei der H0 etwas behauptet, und H1 widerlegt dies. Wo war es möglich, ein ähnliches System zu komponieren:
H0: c = c0;
H1: c ≠ c0.
Es gibt jedoch noch zwei verwandte Widerlegungsmethoden. Beispielsweise besagt die Nullhypothese, dass die Durchschnittsnote einer Klasse mehr als 4,54 beträgt, und die Alternative besagt dann, dass die Durchschnittsnote derselben Klasse weniger als 4,54 beträgt. Und es wird so aussehen:
H0: s 4,54;
H1: c <4,54.
Beachten Sie, dass die Nullhypothese besagt, dass der Wert größer oder gleich ist und der statistische Wert streng kleiner ist. Die Schwere des Ungleichheitszeichens ist von großer Bedeutung!
Statistische Überprüfung
Ein statistischer Test von Nullhypothesen besteht darin, ein statistisches Kriterium zu verwenden. Solche Kriterien unterliegen verschiedenen Vertriebsgesetzen.
Zum Beispiel gibt es ein F-Kriterium, das von der Fisher-Verteilung berechnet wird. Es gibt einen T-Test, der abhängig von der Verteilung der Schüler in der Praxis am häufigsten verwendet wird. Quadratisches Kriterium für Pearsons Zustimmung usw.
Akzeptanzbereich der Nullhypothese
In der Algebra gibt es den Begriff "Bereich zulässiger Werte". Dies ist ein solches Segment oder ein solcher Punkt auf der X-Achse, auf dem es viele Statistikwerte gibt, bei denen die Nullhypothese wahr ist. Die Extrempunkte des Segments sind kritische Werte. Die Strahlen auf der rechten und linken Seite des Segments sind kritische Bereiche. Wenn der gefundene Wert darin enthalten ist, wird die Nullentheorie widerlegt und eine Alternative akzeptiert.
Nullhypothese widerlegt
Die Nullhypothese in der Statistik ist manchmal ein sehr zweifelhaftes Konzept. Während der Überprüfung können zwei Arten von Fehlern auftreten:
1. Die Ablehnung der wahren Nullhypothese. Wir bezeichnen den ersten Typ als a = 1.
2. Akzeptanz der falschen Nullhypothese. Der zweite Typ wird als a = 2 bezeichnet.
Es versteht sich, dass dies nicht die gleichen Parameter sind, die Ergebnisse von Fehlern können erheblich voneinander abweichen und unterschiedliche Stichproben haben.
Ein Beispiel für zwei Arten von Fehlern
Komplexe Konzepte lassen sich anhand eines Beispiels leichter herausfinden.
Bei der Herstellung eines bestimmten Arzneimittels ist äußerste Vorsicht geboten, da eine Überdosis einer der Komponenten eine hohe Toxizität des fertigen Arzneimittels hervorruft, an der Patienten sterben können, die es einnehmen. Auf chemischer Ebene kann jedoch keine Überdosierung festgestellt werden.
Aus diesem Grund wird vor der Freigabe des im Handel erhältlichen Arzneimittels eine kleine Dosis an Ratten oder Kaninchen überprüft, indem ihnen das Arzneimittel verabreicht wird.Wenn die meisten Probanden sterben, darf das Arzneimittel nicht verkauft werden, wenn die Versuchspersonen am Leben sind, darf das Arzneimittel in Apotheken verkauft werden.
Der erste Fall: Tatsächlich war das Medikament nicht toxisch, aber während des Experiments wurde ein Fehler gemacht und das Medikament wurde als toxisch eingestuft und nicht zum Verkauf zugelassen. A = 1.
Der zweite Fall: In einem anderen Experiment wurde bei der Überprüfung einer anderen Charge von Arzneimitteln festgestellt, dass das Arzneimittel nicht toxisch war, und es wurde in den Handel gebracht, obwohl das Arzneimittel tatsächlich giftig war. A = 2.
Die erste Option ist für den Lieferantenunternehmer mit hohen finanziellen Kosten verbunden, da Sie die gesamte Medikamentencharge zerstören und bei Null anfangen müssen.
Die zweite Situation wird den Tod von Patienten provozieren, die dieses Arzneimittel gekauft und angewendet haben.
Wahrscheinlichkeitstheorie
Nicht nur Null, sondern alle Hypothesen in Statistik und Ökonomie sind nach Signifikanzstufen unterteilt.
Signifikanzniveau - der Prozentsatz der Fehler der ersten Art (Abweichung von der wahren Nullhypothese).
• Die erste Stufe ist 5% oder 0,05, dh die Wahrscheinlichkeit eines Fehlers beträgt 5 bis 100 oder 1 bis 20.
• Die zweite Stufe ist 1% oder 0,01, dh die Wahrscheinlichkeit ist 1 bis 100.
• Die dritte Stufe ist 0,1% oder 0,001, die Wahrscheinlichkeit ist 1 bis 1000.
Hypothesentestkriterien
Wenn Wissenschaftler bereits zu dem Schluss gekommen sind, dass die Nullhypothese korrekt ist, muss sie getestet werden. Dies ist erforderlich, um den Fehler zu beheben. Es gibt ein grundlegendes Kriterium zum Testen der Nullhypothese, das aus mehreren Stufen besteht:
1. Die zulässige Fehlerwahrscheinlichkeit P = 0,05 wird angenommen.
2. Statistiken werden für Kriterium 1 ausgewählt.
3. Durch die bekannte Methode wird der Bereich akzeptabler Werte festgelegt.
4. Nun ist der Wert der Statistik T.
5. Gehört T (Statistik) zum Bereich der Akzeptanz der Nullhypothese (wie bei der „Trusting“ -Methode), so gelten die Annahmen als richtig, dh die Nullhypothese selbst bleibt wahr.
So funktionieren Statistiken. Die Nullhypothese wird bei ordnungsgemäßer Überprüfung akzeptiert oder abgelehnt.
Es ist erwähnenswert, dass es für gewöhnliche Unternehmer und Benutzer sehr schwierig sein kann, die ersten drei Stufen genau auszuführen, sodass sie von professionellen Mathematikern als vertrauenswürdig eingestuft werden. 4 und 5 Stufen können jedoch von jeder Person durchgeführt werden, die über ausreichende statistische Überprüfungsmethoden verfügt.