Multivariate Varianzanalyse

Die Varianzanalyse ist eine Reihe statistischer Methoden, mit denen Hypothesen über die Beziehung zwischen bestimmten Zeichen und den zu untersuchenden Faktoren, für die es keine quantitative Beschreibung gibt, geprüft und der Grad des Einflusses von Faktoren und ihrer Wechselwirkung ermittelt werden können. In der Fachliteratur wird es oft ANOVA genannt (vom englischen Namen Analysis of Variations). Diese Methode wurde erstmals 1925 von R. Fisher entwickelt.

Arten und Kriterien der Varianzanalyse

Mit dieser Methode wird die Beziehung zwischen qualitativen (nominalen) Attributen und einer quantitativen (kontinuierlichen) Variablen untersucht. Tatsächlich testet er die Hypothese, dass das arithmetische Mittel mehrerer Stichproben gleich ist. Somit kann es als ein parametrisches Kriterium für den gleichzeitigen Vergleich der Mitten mehrerer Proben angesehen werden. Wenn Sie diese Methode für zwei Stichproben verwenden, stimmen die Ergebnisse der Varianzanalyse mit den Ergebnissen des T-Student-Tests überein. Im Gegensatz zu anderen Kriterien können wir mit dieser Studie das Problem jedoch genauer untersuchen.

Varianzanalyse

Die Varianzanalyse in der Statistik basiert auf dem Gesetz: Die Summe der Quadrate der Abweichungen der kombinierten Stichprobe ist gleich der Summe der Quadrate der gruppeninternen Abweichungen und der Summe der Quadrate der gruppeninternen Abweichungen. Für die Studie wird der Fisher-Test verwendet, um die Signifikanz des Unterschieds zwischen gruppeninternen Varianzen und gruppeninternen Varianzen zu bestimmen. Voraussetzung hierfür ist jedoch die Normalverteilung und Homoskedastizität (Varianzgleichheit) der Proben. Unterscheiden Sie zwischen eindimensionaler (univariater) Varianzanalyse und multivariater (multivariater). Die erste berücksichtigt die Abhängigkeit der untersuchten Menge von einem Attribut, die zweite - unmittelbar von vielen - und ermöglicht es Ihnen, die Beziehung zwischen ihnen zu identifizieren.

Faktoren

Faktoren werden als kontrollierte Umstände bezeichnet, die sich auf das Endergebnis auswirken. Seine Ebene oder Verarbeitungsmethode wird als der Wert bezeichnet, der die spezifische Manifestation dieses Zustands kennzeichnet. Diese Nummern werden normalerweise in einer nominalen oder seriellen Skala angegeben. Leistungswerte werden häufig in quantitativen oder ordinalen Maßstäben gemessen. Dann tritt das Problem auf, die ausgegebenen Daten in einer Reihe von Beobachtungen zu gruppieren, die ungefähr den gleichen numerischen Werten entsprechen. Wenn die Anzahl der Gruppen zu groß gewählt wird, reicht die Anzahl der Beobachtungen möglicherweise nicht aus, um verlässliche Ergebnisse zu erzielen. Wenn Sie die Anzahl zu klein nehmen, kann dies zum Verlust wesentlicher Merkmale der Auswirkung auf das System führen. Die Art und Weise, wie Daten gruppiert werden, hängt vom Volumen und der Art der Variation der Werte ab. Die Anzahl und Größe der Intervalle bei der Einweganalyse wird meistens durch das Prinzip gleicher Intervalle oder durch das Prinzip gleicher Frequenzen bestimmt.

Analyse von Varianzproblemen

Es gibt also Fälle, in denen Sie zwei oder mehr Proben vergleichen müssen. Dann ist die Verwendung der Varianzanalyse ratsam. Der Name der Methode zeigt an, dass Schlussfolgerungen aus der Untersuchung der Komponenten der Varianz gezogen werden. Das Wesentliche der Studie ist, dass die allgemeine Änderung des Indikators in Bestandteile unterteilt ist, die der Wirkung jedes einzelnen Faktors entsprechen. Betrachten Sie eine Reihe von Problemen, die eine typische Varianzanalyse löst.

Beispiel 1

Die Werkstatt verfügt über eine Reihe von Werkzeugmaschinen - Automaten, die ein bestimmtes Teil produzieren. Die Größe jedes Teils ist ein Zufallswert, der von den Einstellungen der einzelnen Maschinen und zufälligen Abweichungen bei der Herstellung der Teile abhängt.Es ist zu bestimmen, ob die Maschinen entsprechend den Abmessungen der Teile gleich konfiguriert sind.

Analyse von Varianzmethoden

Beispiel 2

Bei der Herstellung der elektrischen Geräte werden verschiedene Arten von Isolierpapier verwendet: Kondensator, Elektro usw. Die Geräte können mit verschiedenen Substanzen imprägniert werden: Epoxidharz, Lack, ML-2-Harz usw. Durch Erhitzen können Leckagen unter Vakuum bei hohem Druck beseitigt werden. Es kann durch Eintauchen in Lack, unter einem kontinuierlichen Lackstrom usw. imprägniert werden. Das elektrische Gerät als Ganzes wird mit einer bestimmten Verbindung gegossen, von der es mehrere Möglichkeiten gibt. Qualitätsindikatoren sind die Spannungsfestigkeit der Isolierung, die Temperatur der Überhitzung der Wicklung im Betriebsmodus und eine Reihe anderer. Während des Testens des technologischen Prozesses der Herstellung von Vorrichtungen ist es notwendig zu bestimmen, wie sich jeder der aufgelisteten Faktoren auf die Leistung der Vorrichtung auswirkt.

Beispiel 3

Das Oberleitungsbusdepot bedient mehrere Oberleitungsbuslinien. Für sie arbeiten verschiedene Arten von Obussen, und die Fahrgeldabholung wird von 125 Fahrdienstleitern durchgeführt. Das Depotmanagement interessiert sich für die Frage: Wie kann man die wirtschaftliche Leistung der einzelnen Controller (Einnahmen) unter Berücksichtigung unterschiedlicher Routen, unterschiedlicher Arten von Obussen vergleichen? Wie lässt sich die wirtschaftliche Machbarkeit der Freigabe eines bestimmten Oberleitungsbustyps auf einer bestimmten Strecke ermitteln? Wie können angemessene Anforderungen an die Einnahmen festgelegt werden, die der Schaffner auf jeder Strecke mit verschiedenen Arten von Oberleitungsbussen erzielt?

Bei der Auswahl einer Methode geht es darum, die größtmögliche Information über die Auswirkung eines jeden Faktors auf das Endergebnis zu erhalten, die numerischen Eigenschaften eines solchen Effekts zu bestimmen, ihre Zuverlässigkeit zu den niedrigsten Kosten und in der kürzestmöglichen Zeit. Die Lösung solcher Probleme ermöglicht Methoden zur Varianzanalyse.

Einweganalyse

Die Studie zielt darauf ab, das Ausmaß der Auswirkungen eines bestimmten Falls auf die analysierte Überprüfung zu bewerten. Eine andere Aufgabe der Einweganalyse kann darin bestehen, zwei oder mehr Umstände miteinander zu vergleichen, um den Unterschied in ihrer Auswirkung auf den Rückruf zu bestimmen. Wenn die Nullhypothese verworfen wird, besteht der nächste Schritt in der quantitativen Bewertung und der Erstellung von Konfidenzintervallen für die erhaltenen Merkmale. In dem Fall, wenn Nullhypothese kann nicht verworfen werden, es wird in der Regel akzeptiert und eine Schlussfolgerung auf das Wesen des Einflusses gezogen.

Die univariate Varianzanalyse kann zu einem nichtparametrischen Analogon der Kraskel-Wallis-Rangmethode werden. Es wurde 1952 von dem amerikanischen Mathematiker William Kraskel und dem Ökonomen Wilson Wallis entwickelt. Dieses Kriterium wurde angewendet, um die Nullhypothese zu testen, dass die Auswirkungen auf die untersuchten Proben mit unbekannten, aber gleichen Durchschnittswerten gleich sind. Die Anzahl der Proben sollte mehr als zwei betragen.

Analyse der Varianzstatistik

Das Jonkhier-Kriterium (Jonkhier-Terpstra) wurde 1952 vom niederländischen Mathematiker T. J. Terpstrom und 1954 vom britischen Psychologen E. R. Jonkhier unabhängig vorgeschlagen. Es wird angewendet, wenn im Voraus bekannt ist, dass die verfügbaren Ergebnisgruppen nach geordnet sind das Wachstum des Einflusses des untersuchten Faktors, das auf einer Ordnungsskala gemessen wird.

M - Mit dem Bartlett-Test, den der britische Statistiker Maurice Stevenson Bartlett 1937 vorschlug, wird die Nullhypothese über die Varianzgleichheit mehrerer normaler Allgemeinpopulationen getestet, aus denen die untersuchten Proben entnommen wurden, die im Allgemeinen unterschiedliche Volumina aufweisen (die Anzahl jeder Probe sollte mindestens vier betragen) )

G ist der Cochren-Test, der 1941 vom Amerikaner William Gemmel Cochren entdeckt wurde. Er wird verwendet, um die Nullhypothese zu testen, dass die Varianzen der normalen Allgemeinbevölkerung für unabhängige Proben mit gleichem Volumen gleich sind.

Das nichtparametrische Levene-Kriterium, das der amerikanische Mathematiker Howard Levene 1960 vorschlug, ist eine Alternative zum Bartlett-Kriterium, wenn keine Gewissheit darüber besteht, dass die untersuchten Proben der Normalverteilung entsprechen.

1974 schlugen die amerikanischen Statistiker Morton B. Brown und Alan B. Forsyth einen Test vor (Brown-Forsythe-Kriterium), der sich etwas vom Leuven-Kriterium unterscheidet.

Zwei-Faktor-Analyse

Die Zweiwegevarianzanalyse wird für gekoppelte normalverteilte Proben verwendet. In der Praxis werden häufig komplexe Tabellen dieses Verfahrens verwendet, insbesondere solche, bei denen jede Zelle einen Datensatz (wiederholte Messungen) enthält, der festen Pegelwerten entspricht. Wenn die für die Anwendung der bidirektionalen Varianzanalyse erforderlichen Annahmen nicht erfüllt sind, wird das nichtparametrische Friedman-Rangkriterium (Friedman, Kendall und Smith) verwendet, das der amerikanische Ökonom Milton Friedman Ende 1930 entwickelt hat. Dieses Kriterium ist unabhängig von der Art der Verteilung.

Es wird nur angenommen, dass die Mengenverteilung gleich und stetig ist und sie voneinander unabhängig sind. Beim Testen der Nullhypothese wird die Ausgabe in Form einer rechteckigen Matrix dargestellt, in der die Zeilen den Ebenen des Faktors B und die Spalten den Ebenen von A entsprechen. Jede Zelle der Tabelle (Block) kann das Ergebnis von Messungen von Parametern an einem Objekt oder an einer Gruppe von Objekten bei konstanten Werten der Ebenen beider Faktoren sein . In diesem Fall werden die entsprechenden Daten als Durchschnittswerte eines bestimmten Parameters für alle Messungen oder Objekte der untersuchten Probe geliefert. Um das Kriterium der Ausgabedaten anzuwenden, muss von den direkten Messergebnissen auf deren Rang umgeschaltet werden. Das Ranking wird für jede Zeile separat durchgeführt, dh die Werte werden für jeden festen Wert sortiert.

Varianzanalyse in der Statistik

Das von dem amerikanischen Statistiker E. B. Page 1963 vorgeschlagene Seitenkriterium (L-Kriterium) soll die Nullhypothese testen. Für große Samples wird die Seitenapproximation verwendet. Sie gehorchen, vorbehaltlich der Realität der entsprechenden Nullhypothesen, der Standardnormalverteilung. In dem Fall, dass die Zeilen der Quellentabelle dieselben Werte haben, müssen Durchschnittsränge verwendet werden. Darüber hinaus wird die Genauigkeit der Schlussfolgerungen umso schlechter sein, je mehr solche Übereinstimmungen vorliegen.

Q ist das von V. Cohren 1937 vorgeschlagene Cochren-Kriterium. Es wird in Fällen angewendet, in denen Gruppen homogener Probanden mehr als zwei Personen ausgesetzt sind und für die zwei Antworten möglich sind - bedingt negativ (0) und bedingt positiv (1). . Die Nullhypothese besteht aus gleichen Einflussfaktoren. Die bidirektionale Varianzanalyse ermöglicht es, das Vorhandensein von Verarbeitungseffekten festzustellen, lässt jedoch nicht zu, für welche Spalten dieser Effekt vorliegt. Um dieses Problem zu lösen, wird die Methode mehrerer Sheffe-Gleichungen für gekoppelte Proben verwendet.

Multivariate Analyse

Die Aufgabe der multivariaten Varianzanalyse ergibt sich, wenn der Einfluss von zwei oder mehr Bedingungen auf eine bestimmte Zufallsvariable bestimmt werden muss. Die Studie sieht das Vorhandensein einer abhängigen Zufallsvariablen, gemessen auf der Skala von Unterschieden oder Beziehungen, und mehrerer unabhängiger Variablen vor, von denen jede in der Skala von Namen oder im Rang ausgedrückt wird. Die Analyse von Varianzdaten ist ein ziemlich entwickelter Abschnitt der mathematischen Statistik, der viele Optionen bietet. Das Forschungskonzept gilt sowohl für Einzelfaktoren als auch für Multifaktoren. Das Wesentliche ist, dass die Gesamtvarianz in Komponenten unterteilt ist, die einer bestimmten Datengruppierung entsprechen. Jede Datengruppierung hat ein eigenes Modell.Hier werden nur die grundlegenden Bestimmungen betrachtet, die zum Verständnis und zur praktischen Anwendung der am häufigsten verwendeten Optionen erforderlich sind.

Einweg-Varianzanalyse

Die Analyse der Varianz von Faktoren erfordert eine ziemlich sorgfältige Einstellung zur Sammlung und Darstellung von Eingabedaten und insbesondere zur Interpretation der Ergebnisse. Im Gegensatz zu einem Faktor, dessen Ergebnisse beliebig in eine bestimmte Reihenfolge gebracht werden können, erfordern die Zwei-Faktor-Ergebnisse eine komplexere Darstellung. Eine noch schwierigere Situation ergibt sich, wenn drei, vier oder mehr Umstände vorliegen. Aus diesem Grund sind selten mehr als drei (vier) Bedingungen in einem Modell enthalten. Ein Beispiel ist das Auftreten von Resonanz bei einem bestimmten Wert der Kapazität und Induktivität des elektrischen Kreises; die Manifestation einer chemischen Reaktion mit einer bestimmten Menge von Elementen, aus denen das System aufgebaut ist; das Auftreten von anomalen Effekten in komplexen Systemen mit einem gewissen Zusammentreffen von Umständen. Das Vorhandensein von Wechselwirkungen kann das Modell des Systems grundlegend verändern und manchmal zu einem Umdenken der Art der Phänomene führen, mit denen sich der Experimentator befasst.

Multivariate Varianzanalyse mit wiederholten Experimenten

Messdaten können oft nicht nach zwei, sondern nach einer größeren Anzahl von Faktoren gruppiert werden. Betrachten wir also die Analyse der Varianz der Lebensdauer der Reifen der Oberleitungsbusräder unter Berücksichtigung der Umstände (des Herstellers und der Route, auf der die Reifen betrieben werden), so können wir die Jahreszeit, in der die Reifen betrieben werden (nämlich Winter- und Sommerbetrieb), als getrennte Bedingung unterscheiden. Infolgedessen werden wir die Aufgabe einer Drei-Faktoren-Methode haben.

Wenn mehr Bedingungen vorliegen, ist der Ansatz der gleiche wie bei der Zweifaktoranalyse. In allen Fällen versuchen sie, das Modell zu vereinfachen. Das Phänomen der Wechselwirkung zweier Faktoren tritt nicht so häufig auf, und eine dreifache Wechselwirkung tritt nur in Ausnahmefällen auf. Sie umfassen die Interaktion, für die es frühere Informationen gibt, und gute Gründe, diese im Modell zu berücksichtigen. Das Isolieren und Abrechnen einzelner Faktoren ist relativ einfach. Daher besteht häufig der Wunsch, mehr Umstände hervorzuheben. Dies sollte nicht weggetragen werden. Je mehr Bedingungen vorliegen, desto weniger zuverlässig ist das Modell und desto größer ist die Fehlerwahrscheinlichkeit. Das Modell selbst, das eine große Anzahl unabhängiger Variablen enthält, wird schwierig genug zu interpretieren und für die praktische Anwendung unpraktisch.

Die allgemeine Idee der Varianzanalyse

Die Varianzanalyse in der Statistik ist eine Methode, um die Ergebnisse von Beobachtungen zu erhalten, die von verschiedenen gleichzeitig bestehenden Umständen abhängen, und deren Auswirkungen zu bewerten. Eine Regelgröße, die der Methode zur Beeinflussung des Untersuchungsgegenstandes entspricht und in einem bestimmten Zeitraum einen bestimmten Wert annimmt, wird als Faktor bezeichnet. Sie können qualitativ und quantitativ sein. Niveaus quantitativer Bedingungen erhalten einen bestimmten Wert auf einer numerischen Skala. Beispiele sind Temperatur, Druck, Stoffmenge. Qualitative Faktoren sind unterschiedliche Substanzen, unterschiedliche technologische Methoden, Geräte, Füllstoffe. Ihre Niveaus entsprechen der Skala der Namen.

Varianzanalyse

Die Qualität kann auch die Art des Verpackungsmaterials und die Lagerbedingungen der Darreichungsform umfassen. Es ist auch vernünftig, den Mahlgrad der Rohstoffe der fraktionierten Zusammensetzung der Granulate zuzuordnen, die von quantitativer Bedeutung sind, aber bei Verwendung einer quantitativen Skala schwer zu kontrollieren sind. Die Anzahl der Qualitätsfaktoren hängt von der Art der Darreichungsform sowie von den physikalischen und technologischen Eigenschaften der Arzneistoffe ab. Beispielsweise können Tabletten aus kristallinen Substanzen durch direktes Verpressen erhalten werden. In diesem Fall ist es ausreichend, Gleit- und Schmierstoffe auszuwählen.

Beispiele für qualitative Faktoren für verschiedene Arten von Darreichungsformen

Tinkturen. Die Zusammensetzung des Extraktionsmittels, die Art des Extraktors, das Verfahren zur Herstellung der Rohstoffe, das Herstellungsverfahren, das Filterverfahren.
Extrakte (flüssig, dick, trocken). Die Zusammensetzung des Extraktionsmittels, die Extraktionsmethode, die Art der Anlage, die Methode zur Entfernung des Extraktionsmittels und der Ballaststoffe.
Pillen Die Zusammensetzung von Hilfsstoffen, Füllstoffen, Sprengmitteln, Bindemitteln, Gleitmitteln und Gleitmitteln. Verfahren zur Herstellung von Tabletten, Art der Verarbeitungsausrüstung. Art der Hülle und ihrer Bestandteile, Filmbildner, Pigmente, Farbstoffe, Weichmacher, Lösungsmittel.
Injektionslösungen. Art des Lösungsmittels, Filtrationsmethode, Art der Stabilisatoren und Konservierungsmittel, Sterilisationsbedingungen, Methode zum Füllen von Ampullen.
Zäpfchen. Die Zusammensetzung der Suppositorienbasis, ein Verfahren zur Herstellung von Suppositorien, Füllstoffen, Verpackungen.
Salben. Die Zusammensetzung des Untergrunds, die Strukturkomponenten, die Art der Herstellung der Salbe, die Art der Ausrüstung, die Verpackung.
Kapseln Art des Hüllmaterials, Verfahren zur Herstellung von Kapseln, Art des Weichmachers, Konservierungsmittels, Farbstoff.
Liniment. Art der Herstellung, Zusammensetzung, Art der Ausrüstung, Art des Emulgators.
Suspensionen Art des Lösungsmittels, Art des Stabilisators, Dispersionsmethode.

Beispiele für qualitative Faktoren und ihre Gehalte, die im Herstellungsprozess von Tabletten untersucht wurden

Backpulver. Kartoffelstärke, weißer Ton, eine Mischung aus Natriumbicarbonat mit Zitronensäure, basischem Magnesiumcarbonat.
Bindungslösung. Wasser, Stärkepaste, Zuckersirup, Methylcelluloselösung, Hydroxypropylmethylcelluloselösung, Polyvinylpyrrolidonlösung, Polyvinylalkohollösung.
Gleitende Substanz. Aerosil, Stärke, Talk.
Füller. Zucker, Glucose, Lactose, Natriumchlorid, Calciumphosphat.
Schmiermittel. Stearinsäure, Polyethylenglykol, Paraffin.

Analyse von Varianzmodellen in der Untersuchung der staatlichen Wettbewerbsfähigkeit

Eines der wichtigsten Kriterien für die Beurteilung des Zustands des Staates, das den Stand seines Wohlergehens und seine sozioökonomische Entwicklung beurteilt, ist die Wettbewerbsfähigkeit, dh eine Reihe volkswirtschaftlicher Eigenschaften, die die Wettbewerbsfähigkeit des Staates gegenüber anderen Ländern bestimmen. Nachdem wir den Platz und die Rolle des Staates auf dem globalen Markt festgelegt haben, können wir eine klare Strategie für die Gewährleistung festlegen wirtschaftliche Sicherheit international, weil es der Schlüssel zu positiven Beziehungen zwischen Russland und allen Akteuren auf dem Weltmarkt ist: Investoren, Gläubiger, staatliche Regierungen.

Um die Wettbewerbsfähigkeit der Länder zu vergleichen, werden die Länder anhand komplexer Indizes eingestuft, die verschiedene gewichtete Indikatoren enthalten. Die Basis dieser Indizes sind die Schlüsselfaktoren, die die wirtschaftliche, politische usw. Situation beeinflussen. Eine Reihe von Modellen zur Untersuchung der Wettbewerbsfähigkeit des Staates sieht die Verwendung multivariater statistischer Analysemethoden vor (insbesondere Varianzanalyse (Statistik), ökonometrische Modellierung, Entscheidungsfindung) und umfasst die folgenden Hauptschritte:

Bildung eines Systems von Indikatoren-Indikatoren.
Bewertung und Prognose von Indikatoren der staatlichen Wettbewerbsfähigkeit.
Vergleich von Indikatoren und Indikatoren zur Wettbewerbsfähigkeit von Staaten.

Betrachten Sie nun den Inhalt der Modelle der einzelnen Phasen dieses Komplexes.

In der ersten Phase Mit Hilfe fachkundiger Untersuchungsmethoden wird ein gerechtfertigter Satz von Wirtschaftsindikatoren - Indikatoren zur Beurteilung der Wettbewerbsfähigkeit des Staates - gebildet, der die Besonderheiten seiner Entwicklung auf der Grundlage internationaler Ratings und Daten von statistischen Ämtern berücksichtigt, die den Zustand des gesamten Systems und seiner Prozesse widerspiegeln.Die Wahl dieser Indikatoren ist gerechtfertigt, weil diejenigen ausgewählt werden müssen, die es aus praktischer Sicht am umfassendsten ermöglichen, das Niveau des Staates, seine Investitionsattraktivität und die Möglichkeiten der relativen Lokalisierung bestehender potenzieller und realer Bedrohungen zu bestimmen.

Datenanalyse der Varianz

Die wichtigsten Indikatoren und Indikatoren für internationale Ratingsysteme sind die Indizes:

Globale Wettbewerbsfähigkeit (IGC).
Wirtschaftsfreiheit (IES).
Menschliche Entwicklung (HDI).
Wahrnehmung von Korruption (CPI).
Interne und externe Bedrohungen.
Das Potenzial des internationalen Einflusses (IPMV).

Zweite Stufe Es sieht die Bewertung und Prognose von Indikatoren der staatlichen Wettbewerbsfähigkeit nach internationalen Ratings für die untersuchten 139 Länder der Welt vor.

Dritte Stufe bietet einen methodischen Vergleich der Wettbewerbsbedingungen von Staaten Korrelations- und Regressionsanalyse.

Anhand der Ergebnisse der Studie ist es möglich, die Art der Prozesse als Ganzes und nach einzelnen Komponenten der Wettbewerbsfähigkeit des Staates zu bestimmen; Testen Sie die Hypothese des Einflusses von Faktoren und ihrer Beziehung zu angemessenen Signifikanzniveau.

Die Umsetzung des vorgeschlagenen Modellsatzes wird es nicht nur ermöglichen, die aktuelle Situation der Wettbewerbsfähigkeit und der Investitionsattraktivität der Staaten zu beurteilen, sondern auch die Schwächen des Managements zu analysieren, Fehler bei falschen Entscheidungen zu vermeiden und die Entwicklung einer Staatskrise zu verhindern.