Analýza rozptylu je soubor statistických metod určených k testování hypotéz o vztahu mezi určitými příznaky a studovanými faktory, které nemají kvantitativní popis, a také ke stanovení míry vlivu faktorů a jejich vzájemného působení. V odborné literatuře se často nazývá ANOVA (z anglického názvu Analýza variací). Tato metoda byla poprvé vyvinuta R. Fisherem v roce 1925.
Typy a kritéria analýzy rozptylu
Tato metoda se používá ke studiu vztahu mezi kvalitativními (nominálními) atributy a kvantitativní (spojitou) proměnnou. Ve skutečnosti testuje hypotézu, že aritmetický průměr několika vzorků je stejný. Lze jej tedy považovat za parametrické kritérium pro srovnání center několika vzorků najednou. Pokud použijete tuto metodu pro dva vzorky, budou výsledky analýzy rozptylu identické s výsledky t-studentského testu. Na rozdíl od jiných kritérií však tato studie umožňuje podrobněji studovat problém.
Analýza rozptylu ve statistice je založena na zákonu: součet čtverců odchylek kombinovaného vzorku se rovná součtu čtverců odchylek uvnitř skupiny a součtu čtverců odchylek mezi skupinami. Pro studii se používá Fisherův test ke stanovení významu rozdílu mezi meziskupinovými odchylkami od meziskupinových variací. K tomu jsou však nezbytnými předpoklady normální distribuce a homoskedasticita (rovnice rozptylu) vzorků. Rozlišujte mezi jednorozměrnou (univariační) analýzou rozptylu a multivariační (multivariační). První zvažuje závislost studovaného množství na jednom atributu, druhý - hned na mnoha, a také vám umožňuje identifikovat vztah mezi nimi.
Faktory
Faktory se nazývají kontrolované okolnosti, které ovlivňují konečný výsledek. Jeho úroveň nebo způsob zpracování se nazývá hodnota, která charakterizuje konkrétní projev této podmínky. Tato čísla jsou obvykle uváděna v nominální nebo sériové stupnici. Výstupní hodnoty se často měří v kvantitativních nebo řadových měřítcích. Poté vyvstává problém seskupení výstupních dat do řady pozorování, které odpovídají přibližně stejným číselným hodnotám. Pokud je počet skupin považován za příliš vysoký, pak počet pozorování v nich nemusí být dostatečný pro získání spolehlivých výsledků. Pokud vezmete číslo příliš malé, může to vést ke ztrátě významných vlastností dopadu na systém. Konkrétní způsob seskupování dat závisí na objemu a povaze variace hodnot. Počet a velikost intervalů v jednosměrné analýze je nejčastěji určován principem stejných intervalů nebo principem stejných frekvencí.
Analýza problémů rozptylu
Jsou tedy případy, kdy potřebujete porovnat dva nebo více vzorků. Je tedy vhodné použít analýzu rozptylu. Název metody naznačuje, že závěry jsou vyvozeny ze studia složek rozptylu. Podstatou studie je, že obecná změna ukazatele je rozdělena na složky, které odpovídají působení každého jednotlivého faktoru. Zvažte řadu problémů, které řeší typická analýza rozptylu.
Příklad 1
Dílna má řadu obráběcích strojů - automatické stroje, které vyrábějí konkrétní součást. Velikost každé součásti je náhodná hodnota, která závisí na nastavení každého stroje a náhodných odchylkách, ke kterým dochází během výroby součástí.Je nutné určit, zda jsou stroje stejně konfigurovány podle měření rozměrů součástí.
Příklad 2
Při výrobě elektrického zařízení se používají různé typy izolačního papíru: kondenzátor, elektrický atd. Přístroj může být impregnován různými látkami: epoxidovou pryskyřicí, lakem, pryskyřicí ML-2 atd. Úniky mohou být odstraněny ve vakuu při vysokém tlaku, zahříváním. Může být impregnována ponořením do laku, pod kontinuální proud laku atd. Elektrické zařízení jako celek je nalito určitou směsí, z nichž existuje několik možností. Indikátory kvality jsou dielektrická pevnost izolace, teplota přehřátí vinutí v provozním režimu a řada dalších. Při testování technologického procesu výrobních přístrojů je nutné určit, jak každý z uvedených faktorů ovlivňuje výkon přístroje.
Příklad 3
Trolejbusové skladiště obsluhuje několik trolejbusových tras. Pracují pro ně různé typy trolejbusů a sběr jízdného shromažďuje 125 ovladačů. Vedení skladu se zajímá o otázku: jak porovnat ekonomickou výkonnost každého správce (výnos) s ohledem na různé trasy, různé typy trolejbusů? Jak určit ekonomickou proveditelnost uvolnění určitého typu trolejbusu na konkrétní trase? Jak stanovit přiměřené požadavky na výši výnosu, který dirigent přinese na každé trase v různých typech trolejbusů?
Úkolem výběru metody je, jak získat co nejvíce informací o dopadu na konečný výsledek každého faktoru, určit numerické charakteristiky takového efektu, jejich spolehlivost při co nejnižších nákladech a v co nejkratší možné době. Řešení takových problémů umožňuje metody analýzy rozptylu.
Jednosměrná analýza
Cílem studie je posoudit velikost dopadu konkrétního případu na analyzovaný přezkum. Dalším úkolem jednosměrné analýzy může být porovnání dvou nebo více okolností mezi sebou, aby se určil rozdíl v jejich účinku na stažení. Pokud bude nulová hypotéza odmítnuta, pak dalším krokem bude kvantitativní hodnocení a konstrukce intervalů spolehlivosti pro získané charakteristiky. V případě kdy nulová hypotéza nelze je vyřadit, obvykle se přijímá a je učiněn závěr o podstatě vlivu.
Univariační analýza rozptylu se může stát neparametrickým analogem Kraskel-Wallisovy metody. Byl vyvinut americkým matematikem Williamem Kraskelem a ekonomem Wilsonem Wallisem v roce 1952. Toto kritérium bylo určeno pro testování nulové hypotézy, že účinky na studované vzorky jsou stejné jako neznámé, ale stejné průměrné hodnoty. Počet vzorků by měl být více než dva.
Jonkhierovo kritérium (Jonkhier-Terpstra) bylo navrženo nezávisle nizozemským matematikem T.J. Terpstromem v roce 1952 a britským psychologem E.R. Jonkhierem v roce 1954. Používá se, pokud je předem známo, že dostupné skupiny výsledků jsou řazeny růst vlivu studovaného faktoru, který se měří v ordinálním měřítku.
M - Bartlettův test, navržený britským statistikem Mauricem Stevensonem Bartlettem v roce 1937, se používá k testování nulové hypotézy o rovnosti rozptylů několika normálních obecných populací, z nichž byly odebrány studované vzorky, obecně s různými objemy (počet každého vzorku by měl být nejméně čtyři )
G je Cochrenův test, který objevil Američan William Gemmel Cochren v roce 1941. Používá se k testování nulové hypotézy, že rozptyly normálních obecných populací jsou stejné pro nezávislé vzorky stejného objemu.
Neparametrické Leveneovo kritérium, které navrhl americký matematik Howard Levene v roce 1960, je alternativou k Bartlettovu kritériu v podmínkách, kdy není jisté, že sledované vzorky dodržují normální rozdělení.
V roce 1974 navrhli američtí statistici Morton B. Brown a Alan B. Forsyth test (kritérium Brown-Forsythe), který se poněkud liší od leuvenského kritéria.
Dvoufázová analýza
Pro vázané normálně distribuované vzorky se používá obousměrná analýza rozptylu. V praxi se často používají složité tabulky této metody, zejména ty, ve kterých každá buňka obsahuje soubor dat (opakovaná měření) odpovídající hodnotám na pevné úrovni. Nejsou-li splněny předpoklady nutné pro použití obousměrné analýzy rozptylu, použije se neparametrické Friedmanovo pořadí (Friedman, Kendall a Smith) vyvinuté americkým ekonomem Miltonem Friedmanem na konci roku 1930. Toto kritérium je nezávislé na typu distribuce.
Předpokládá se pouze, že rozdělení množství je stejné a nepřetržité a že jsou na sobě nezávislé. Při testování nulové hypotézy je výstup prezentován ve formě pravoúhlé matice, ve které řádky odpovídají hladinám faktoru B a sloupce odpovídají hladinám A. Každá buňka tabulky (blok) může být výsledkem měření parametrů na jednom objektu nebo na skupině objektů při konstantních hodnotách hladin obou faktorů . V tomto případě jsou odpovídající data poskytována jako průměrné hodnoty určitého parametru pro všechna měření nebo objekty studovaného vzorku. Pro uplatnění kritéria výstupních dat je nutné přepnout z přímých výsledků měření na jejich pořadí. Hodnocení se provádí pro každý řádek zvlášť, to znamená, že hodnoty jsou seřazeny pro každou pevnou hodnotu.
Page kritérium (L-kritérium), navržené americkým statistikem E. B. Page v roce 1963, má za cíl otestovat nulovou hypotézu. Pro velké vzorky se používá aproximace stránky. Podléhají realitě odpovídajících nulových hypotéz, dodržují standardní normální rozdělení. V případě, že řádky zdrojové tabulky mají stejné hodnoty, je nutné použít průměrné hodnosti. Přesnost závěrů bude navíc horší, čím více bude počet takových náhod.
Q je Cochrenovo kritérium navržené V. Cohrenem v roce 1937. Používá se v případech, kdy jsou skupiny homogenních subjektů vystaveny více než dvěma a pro které jsou možné dvě odpovědi - podmíněně negativní (0) a podmíněně pozitivní (1) . Nulová hypotéza se skládá ze stejných účinků vlivu. Obousměrná analýza rozptylu umožňuje určit existenci efektů zpracování, ale neumožňuje určit, pro které sloupce tento efekt existuje. K vyřešení tohoto problému se používá metoda několika Sheffeových rovnic pro vázané vzorky.
Vícerozměrná analýza
Úloha vícerozměrné analýzy rozptylu vyvstává, když je nutné určit vliv dvou nebo více podmínek na určitou náhodnou proměnnou. Studie stanoví přítomnost jedné závislé náhodné proměnné, měřené na stupnici rozdílu nebo vztahů, a několika nezávislých proměnných, z nichž každá je vyjádřena v stupnici jmen nebo v pořadí. Analýza dat rozptylu je poměrně rozvinutá část matematické statistiky, která má mnoho možností. Koncepce výzkumu je společná pro jednofaktorový i vícefaktorový. Jeho podstatou je, že celková variance je rozdělena na komponenty, což odpovídá určitému seskupení dat. Každé seskupení dat má svůj vlastní model.Zde se budeme zabývat pouze základními ustanoveními nezbytnými pro pochopení a praktické využití jeho nejpoužívanějších možností.
Analýza rozptylu faktorů vyžaduje poměrně pečlivý přístup ke shromažďování a prezentaci vstupních údajů, a zejména k interpretaci výsledků. Na rozdíl od jednofaktorů, jejichž výsledky lze libovolně umístit do určité sekvence, vyžadují dvafaktorové výsledky složitější reprezentaci. Ještě obtížnější situace nastává, když existují tři, čtyři nebo více okolností. Z tohoto důvodu jsou do modelu zřídka zahrnuty více než tři (čtyři) podmínky. Příkladem je výskyt rezonance při určité hodnotě kapacitance a indukčnosti elektrického kruhu; projev chemické reakce s určitou sadou prvků, z nichž je systém sestaven; výskyt anomálních efektů ve složitých systémech s určitou shodou okolností. Přítomnost interakce může zásadně změnit model systému a někdy může vést k přehodnocení povahy jevů, s nimiž se experimentátor zabývá.
Vícerozměrná analýza rozptylu s opakovanými experimenty
Data měření mohou být často seskupena ne podle dvou, ale podle většího počtu faktorů. Pokud tedy vezmeme v úvahu analýzu odchylky životnosti pneumatik kol trolejbusu s přihlédnutím k okolnostem (výrobce a trasa, na které jsou pneumatiky provozovány), můžeme rozlišit období, v němž jsou pneumatiky provozovány (konkrétně zimní a letní provoz), jako samostatnou podmínku. Výsledkem bude úkol metody tří faktorů.
Pokud existuje více podmínek, je přístup stejný jako ve dvoufaktorové analýze. Ve všech případech se snaží model zjednodušit. Fenomén interakce dvou faktorů není tak často projevován a k trojité interakci dochází pouze ve výjimečných případech. Zahrnují interakci, pro kterou existují předchozí informace, a dobré důvody, proč je v modelu zohlednit. Proces izolace jednotlivých faktorů a jejich zohlednění je relativně jednoduchý. Proto je často potřeba zdůraznit více okolností. To by se nemělo odnášet. Čím více podmínek, tím méně spolehlivý se model stává a větší pravděpodobnost chyby. Samotný model, který obsahuje velké množství nezávislých proměnných, se stává obtížným pro interpretaci a nepohodlný pro praktické použití.
Obecná myšlenka analýzy rozptylu
Analýza rozptylu ve statistice je metoda získávání výsledků pozorování, která jsou závislá na různých současně existujících okolnostech, a hodnocení jejich dopadu. Řízená proměnná, která odpovídá metodě ovlivňování předmětu studia a v určitém časovém období získává určitou hodnotu, se nazývá faktor. Mohou být kvalitativní a kvantitativní. Úrovně kvantitativních podmínek získávají určitou hodnotu v číselném měřítku. Příklady jsou teplota, tlak, množství látky. Kvalitativními faktory jsou různé látky, různé technologické metody, zařízení, plniva. Jejich úrovně odpovídají stupnici jmen.
Kvalita může také zahrnovat druh obalového materiálu, podmínky skladování lékové formy. Je také rozumné přiřadit stupeň mletí surovin, frakční složení granulí, které mají kvantitativní význam, ale je obtížné je kontrolovat, pokud se použije kvantitativní měřítko. Počet faktorů kvality závisí na typu lékové formy a na fyzikálních a technologických vlastnostech léčivých látek. Například tablety lze získat z krystalických látek přímým lisováním. V tomto případě stačí vybrat kluznou a mazací látku.
Příklady kvalitativních faktorů pro různé typy lékových forem
- Tinktury. Složení extrakčního činidla, druh extraktoru, způsob přípravy surovin, výrobní postup, filtrační metoda.
- Extrakty (tekuté, silné, suché). Složení extrakčního činidla, způsob extrakce, typ zařízení, způsob odstraňování extrakčního činidla a balastních látek.
- Prášky Složení pomocných látek, plniv, dezintegrantů, pojiv, lubrikantů a kluzných látek. Způsob výroby tablet, druh zpracovatelského zařízení. Typ skořápky a jejích složek, filmotvorné látky, pigmenty, barviva, změkčovadla, rozpouštědla.
- Injekční roztoky. Typ rozpouštědla, filtrační metoda, povaha stabilizátorů a konzervačních látek, podmínky sterilizace, způsob plnění ampulí.
- Čípky. Složení čípkového základu, způsob výroby čípků, plniva, balení.
- Masti. Složení podkladu, strukturální složky, způsob přípravy masti, typ zařízení, balení.
- Kapsle Druh materiálu pláště, způsob výroby kapslí, typ změkčovadla, konzervační látka, barvivo
- Liniment. Způsob přípravy, složení, typ zařízení, typ emulgátoru.
- Pozastavení Typ rozpouštědla, typ stabilizátoru, disperzní metoda.
Příklady kvalitativních faktorů a jejich úrovně studované ve výrobním procesu tablet
- Prášek do pečiva. Bramborový škrob, bílá hlína, směs hydrogenuhličitanu sodného s kyselinou citronovou, bazický uhličitan hořečnatý.
- Vazebné řešení. Voda, škrobová pasta, cukerný sirup, roztok methylcelulózy, roztok hydroxypropylmethylcelulózy, roztok polyvinylpyrrolidonu, roztok polyvinylalkoholu.
- Kluzná látka. Aerosil, škrob, mastek.
- Výplň. Cukr, glukóza, laktóza, chlorid sodný, fosforečnan vápenatý.
- Mazivo. Kyselina stearová, polyethylenglykol, parafin.
Analýza variačních modelů při studiu konkurenceschopnosti státu
Jedním z nejdůležitějších kritérií pro hodnocení stavu státu, který hodnotí úroveň jeho blahobytu a sociálně-ekonomického rozvoje, je konkurenceschopnost, tj. Soubor vlastností vlastní národní ekonomice, které určují schopnost státu konkurovat jiným zemím. Po určení místa a úlohy státu na globálním trhu můžeme stanovit jasnou strategii pro zajištění ekonomická bezpečnost mezinárodně, protože je to klíč k pozitivním vztahům mezi Ruskem a všemi hráči na světovém trhu: investoři, věřitelé, státní vlády.
Pro srovnání úrovně konkurenceschopnosti zemí jsou země seřazeny podle složitých ukazatelů, které zahrnují různé vážené ukazatele. Základem těchto indexů jsou klíčové faktory ovlivňující ekonomickou, politickou atd. Situaci. Soubor modelů pro studium konkurenceschopnosti státu zajišťuje použití vícerozměrných statistických analytických metod (zejména analýzu rozptylu (statistika), ekonometrické modelování, rozhodování) a zahrnuje následující hlavní kroky:
- Formování systému indikátorů-indikátorů.
- Hodnocení a predikce indikátorů konkurenceschopnosti státu.
- Porovnání ukazatelů - ukazatelů konkurenceschopnosti států.
Nyní zvažte obsah modelů každé z fází tohoto komplexu.
V první fázi S pomocí expertních studijních metod je vytvářen oprávněný soubor ekonomických ukazatelů - indikátorů posuzování konkurenceschopnosti státu s přihlédnutím ke specifikům jeho vývoje na základě mezinárodních ratingů a dat ze statistických oddělení, která odrážejí stav systému jako celku a jeho procesy.Volba těchto ukazatelů je odůvodněna potřebou vybrat ty, které z hlediska praxe co nejúplněji umožňují určit úroveň státu, jeho investiční atraktivitu a možnosti relativní lokalizace existujících potenciálních a reálných životních hrozeb.
Hlavními ukazateli - ukazateli mezinárodních ratingových systémů jsou indexy:
- Globální konkurenceschopnost (IGC).
- Ekonomická svoboda (IES).
- Lidský rozvoj (HDI).
- Vnímání korupce (CPI).
- Vnitřní a vnější hrozby.
- Potenciál mezinárodního vlivu (IPMV).
Druhá fáze Zajišťuje hodnocení a předpovídání ukazatelů konkurenceschopnosti státu podle mezinárodních hodnocení sledovaných 139 zemí světa.
Třetí fáze poskytuje srovnání podmínek konkurenceschopnosti států pomocí metod korelační a regresní analýza.
Na základě výsledků studie je možné určit povahu procesů jako celku a podle jednotlivých složek konkurenceschopnosti státu; otestovat hypotézu vlivu faktorů a jejich vztah k příslušným úroveň významnosti.
Implementace navrhovaného souboru modelů umožní nejen posoudit současnou situaci na úrovni konkurenceschopnosti a investiční atraktivity států, ale také analyzovat slabosti řízení, předcházet chybám nesprávných rozhodnutí a zabránit rozvoji krize ve státě.