La statistique est une science complexe qui consiste à mesurer et à analyser diverses données. Comme dans beaucoup d'autres disciplines, le concept d'hypothèse existe dans ce secteur. Ainsi, une hypothèse en statistique est une position qui doit être acceptée ou rejetée. De plus, dans ce secteur, il existe plusieurs types d’hypothèses de ce type, similaires par définition, mais différentes dans la pratique. L'hypothèse nulle est le sujet d'étude d'aujourd'hui.
Du général au particulier: hypothèses en statistique
Une autre, non moins importante, s’écarte de la définition de base des hypothèses: l’hypothèse statistique est l’étude de la totalité des objets importants pour la science sur lesquels les scientifiques tirent des conclusions. Il peut être vérifié en utilisant un échantillon (une partie de la population). Voici quelques exemples d'hypothèses statistiques:
1. La performance de toute la classe peut dépendre du niveau d'éducation de chaque élève.
2. Le cours initial de mathématiques est acquis à égalité à la fois aux enfants qui entrent à l’école à 6 ans et aux enfants à 7 ans.
En statistique, une hypothèse simple est appelée une telle hypothèse, qui caractérise de manière unique un certain paramètre d'une quantité prise par un scientifique.
Complexe consiste en plusieurs ou un nombre infini de simples. Indiquez une zone ou pas une réponse exacte.
Il est utile de comprendre plusieurs définitions d’hypothèses en statistique afin de ne pas les confondre dans la pratique.
Le concept de l'hypothèse nulle
L'hypothèse nulle est une théorie selon laquelle il existe quelques deux agrégats qui ne diffèrent pas l'un de l'autre. Cependant, au niveau scientifique, il n'y a pas de concept de "ne diffère pas", mais il y a "leur similitude est zéro". A partir de cette définition, le concept a été formé. En statistique, l'hypothèse nulle est désignée par H0. De plus, la valeur extrême de l'impossible (improbable) est comprise entre 0,01 et 0,05 ou moins.
Mieux vaut comprendre quelle est l'hypothèse nulle, un exemple tiré de la vie aidera. L'enseignant de l'université a suggéré que le niveau différent de préparation des étudiants des deux groupes au travail de test est dû à des paramètres insignifiants, des raisons aléatoires n'affectant pas le niveau général d'éducation (la différence dans la préparation des deux groupes d'étudiants est nulle).
Cependant, il est utile de donner un exemple d'hypothèse alternative - une hypothèse qui réfute l'affirmation de la théorie du zéro (H1). Par exemple: le directeur de l'université a suggéré que le niveau différent de préparation du travail de test pour les étudiants des deux groupes est dû à l'utilisation de méthodes d'enseignement différentes par les enseignants (la différence dans la préparation des deux groupes est importante et une explication existe).
Vous pouvez maintenant voir immédiatement la différence entre les concepts d '«hypothèse nulle» et «d'hypothèse alternative». Des exemples illustrent ces concepts.
Test d'hypothèses
Créer une hypothèse est la moitié du problème. Un véritable défi pour les débutants consiste à tester l'hypothèse nulle. C'est ici que beaucoup s'attendent à des difficultés.
En utilisant la méthode des hypothèses alternatives, qui affirme le contraire de la théorie du zéro, vous pouvez comparer les deux options et choisir la bonne. Voici comment fonctionnent les statistiques.
Soit l'hypothèse nulle H0 et l'alternative H1, puis:
H0: c = c0;
H1: c ≠ c0.
Ici c est une certaine valeur moyenne de la population à trouver et c0 est la valeur donnée initialement par rapport à laquelle l'hypothèse est vérifiée. Il existe également un certain nombre X - la valeur moyenne de l'échantillon par laquelle c0 est déterminé.
La vérification consiste donc à comparer X et c0. Si X = c0, l'hypothèse nulle est acceptée. Si X ≠ c0, alors l'hypothèse est considérée comme vraie.
Méthode de vérification de confiance
Il existe le moyen le plus efficace par lequel l’hypothèse statistique nulle est facilement vérifiée en pratique. Cela consiste à construire une plage de valeurs allant jusqu'à 95% de précision.
Tout d'abord, vous devez connaître la formule de calcul de l'intervalle de confiance:
X - t * Sx ≤ c ≤ X + t * Sx,
où X est le nombre initialement donné basé sur une hypothèse alternative;
t - valeurs tabulaires (coefficient d'élève);
Sx est l'erreur moyenne standard calculée en tant que Sx = σ / √n, le numérateur représentant l'écart type et le dénominateur la taille de l'échantillon.
Alors, supposons la situation. Avant réparation, le convoyeur produisait 32,1 kg de produits finis par jour et après réparation, selon l’entrepreneur, l’efficacité augmentait, et le convoyeur, selon un contrôle hebdomadaire, commençait à produire en moyenne 39,6 kg.
L'hypothèse nulle soutiendra que les réparations n'ont pas affecté l'efficacité du convoyeur. Une hypothèse alternative dira que la réparation a fondamentalement modifié l'efficacité du convoyeur, améliorant ainsi sa productivité.
Dans le tableau, nous trouvons n = 7, t = 2 447, d'où la formule prendra la forme suivante:
39,6 - 2,447 * 4,2 ≤ s ≤ 39,6 + 2,477 * 4,2;
29,3 ≤ s ≤ 49,9.
Il s’avère que la valeur 32.1 se situe dans la plage et que, par conséquent, la valeur proposée par la variante - 39.6 - n’est pas automatiquement acceptée. Rappelez-vous que l'hypothèse nulle est d'abord vérifiée pour l'exactitude, puis l'inverse.
Variétés de déni
Avant cela, une telle option de construction d’hypothèses était envisagée, où H0 prétend quelque chose et H1 le réfute. D'où il était possible de composer un système similaire:
H0: c = c0;
H1: c ≠ c0.
Mais il existe deux autres méthodes de réfutation connexes. Par exemple, l'hypothèse nulle indique que la note moyenne d'une classe est supérieure à 4,54, et l'alternative dira alors que la note moyenne de la même classe est inférieure à 4,54. Et cela ressemblera à un système comme celui-ci:
H0: s = 4,54;
H1: c <4,54.
Notez que l'hypothèse nulle indique que la valeur est supérieure ou égale, et la valeur statistique est strictement inférieure. La sévérité du signe d'inégalité est d'une grande importance!
Vérification statistique
Un test statistique des hypothèses nulles consiste à utiliser un critère statistique. Ces critères sont soumis à diverses lois sur la distribution.
Par exemple, il existe un critère F calculé par la distribution de Fisher. Il existe un test T, le plus souvent utilisé dans la pratique, en fonction de la répartition des étudiants. Critère carré du consentement de Pearson, etc.
Zone d'acceptation de l'hypothèse nulle
En algèbre, il existe le concept de "région de valeurs autorisées". Il s’agit d’un segment ou d’un point de l’axe des X sur lequel il existe de nombreuses valeurs statistiques pour lesquelles l’hypothèse nulle est vraie. Les points extrêmes du segment sont des valeurs critiques. Les rayons à droite et à gauche du segment sont des régions critiques. Si la valeur trouvée y est incluse, la théorie du zéro est réfutée et une alternative est acceptée.
Réfutation de l'hypothèse nulle
L’hypothèse nulle en statistique est parfois un concept très louche. Lors de la vérification, deux types d’erreurs peuvent être générés:
1. Le rejet de la véritable hypothèse nulle. Nous désignons le premier type par a = 1.
2. Acceptation de l'hypothèse nulle erronée. Le second type est noté a = 2.
Il faut comprendre que ce ne sont pas les mêmes paramètres, les résultats des erreurs peuvent varier considérablement entre eux et avoir des échantillons différents.
Un exemple de deux types d'erreurs
Les concepts complexes sont plus faciles à comprendre avec un exemple.
Les scientifiques doivent faire preuve d'une extrême prudence lors de la fabrication d'un médicament, car le dépassement de la dose de l'un des composants provoque une forte toxicité du produit fini, pouvant entraîner la mort des patients qui l'utilisent. Cependant, au niveau chimique, un surdosage ne peut pas être détecté.
De ce fait, avant de mettre en vente le médicament, une petite dose est contrôlée chez le rat ou le lapin en lui administrant le médicament.Si la plupart des sujets décèdent, la vente du médicament n'est pas autorisée. Si les sujets expérimentaux sont vivants, le médicament peut être vendu en pharmacie.
Premier cas: en fait, le médicament n'était pas toxique, mais au cours de l'expérience, une erreur a été commise et le médicament a été classé comme toxique et sa vente n'a pas été autorisée. A = 1.
Deuxième cas: lors d’une autre expérience, lors du contrôle d’un autre lot de médicament, il avait été décidé que le médicament n’était pas toxique et il avait été autorisé à être mis en vente, bien que le médicament fût un poison. A = 2.
La première option entraînera des coûts financiers importants pour le fournisseur-entrepreneur, car vous devez détruire tout le lot de médicaments et repartir à zéro.
La deuxième situation provoquera la mort des patients qui ont acheté et utilisé ce médicament.
Théorie de probabilité
Non seulement zéro, mais toutes les hypothèses en statistique et en économie sont divisées par niveau de signification.
Niveau de signification - le pourcentage d'erreurs du premier type (déviation de l'hypothèse nulle vraie).
• le premier niveau est de 5% ou 0,05, c'est-à-dire que la probabilité d'erreur est de 5 à 100 ou de 1 à 20.
• le deuxième niveau est 1% ou 0,01, c'est-à-dire que la probabilité est comprise entre 1 et 100.
• le troisième niveau est 0,1% ou 0,001, la probabilité est de 1 à 1000.
Critères du test d'hypothèses
Si les scientifiques ont déjà conclu que l'hypothèse nulle est correcte, il faut alors la tester. Ceci est nécessaire pour éliminer l'erreur. Il existe un critère de base pour tester l'hypothèse nulle, composé de plusieurs étapes:
1. La probabilité d'erreur admissible P = 0.05 est prise.
2. Les statistiques sont sélectionnées pour le critère 1.
3. Par la méthode bien connue est la gamme de valeurs acceptables.
4. Maintenant la valeur de la statistique T.
5. Si T (statistiques) appartient au domaine de l'acceptation de l'hypothèse nulle (comme dans la méthode de «confiance»), alors les hypothèses sont considérées comme correctes, ce qui signifie que l'hypothèse nulle reste vraie.
Voici comment fonctionnent les statistiques. L'hypothèse nulle, avec une vérification appropriée, sera acceptée ou rejetée.
Il est à noter que pour les entrepreneurs et utilisateurs ordinaires, les trois premières étapes peuvent être très difficiles à exécuter avec précision, de sorte que les mathématiciens professionnels leur font confiance. Mais 4 et 5 étapes peuvent être effectuées par toute personne connaissant suffisamment de méthodes de vérification statistiques.