Analiza varianței este un set de metode statistice concepute pentru a testa ipoteze despre relația dintre anumite semne și factorii studiați, care nu au o descriere cantitativă, precum și pentru a stabili gradul de influență a factorilor și interacțiunea lor. În literatura de specialitate se numește adesea ANOVA (din denumirea engleză Analysis of Variations). Această metodă a fost dezvoltată pentru prima dată de R. Fisher în 1925.
Tipuri și criterii de analiză a variației
Această metodă este utilizată pentru a studia relația dintre atributele calitative (nominale) și o variabilă cantitativă (continuă). De fapt, el testează ipoteza că media aritmetică a mai multor probe este egală. Astfel, poate fi considerat un criteriu parametric pentru compararea centrelor mai multor probe simultan. Dacă utilizați această metodă pentru două probe, rezultatele analizei variației vor fi identice cu rezultatele testului t-student. Cu toate acestea, spre deosebire de alte criterii, acest studiu ne permite să studiem problema mai detaliat.
Analiza variației statisticilor se bazează pe lege: suma pătratelor abaterilor eșantionului combinat este egală cu suma pătratelor deviațiilor intragrup și suma pătratelor abaterilor intergrupului. Pentru studiu, testul Fisher este utilizat pentru a stabili semnificația diferenței dintre variațiile intergrupului de variațiile intragrup. Totuși, pentru aceasta, premisele necesare sunt distribuția normală și homoskedasticitatea (egalitatea de varianțe) a probelor. Distingeți între analiza varianței unidimensionale (univariate) și multivariate (multivariate). Primul ia în considerare dependența cantității studiate de un atribut, al doilea - imediat de multe și, de asemenea, vă permite să identificați relația dintre ei.
factori
Factorii sunt numiți circumstanțe controlate care afectează rezultatul final. Nivelul sau metoda de prelucrare este denumită valoarea care caracterizează manifestarea specifică a acestei afecțiuni. Aceste numere sunt de obicei date într-o scară nominală sau serială. Adesea, valorile de ieșire sunt măsurate în scări cantitative sau ordinale. Atunci apare problema grupării datelor de ieșire într-o serie de observații, care corespund aproximativ acelorași valori numerice. Dacă numărul de grupuri este considerat excesiv de mare, atunci numărul de observații din acestea poate fi insuficient pentru a obține rezultate fiabile. Dacă luați numărul prea mic, acest lucru poate duce la pierderea caracteristicilor semnificative ale impactului asupra sistemului. Modul specific de grupare a datelor depinde de volumul și natura variației valorilor. Numărul și dimensiunea intervalelor în analiza unidirecțională sunt cel mai adesea determinate de principiul intervalelor egale sau de principiul frecvențelor egale.
Analiza problemelor de varianță
Deci, există cazuri când trebuie să comparați două sau mai multe probe. Atunci se recomandă utilizarea analizei de varianță. Numele metodei indică faptul că concluziile sunt trase din studiul componentelor variației. Esența studiului este că schimbarea generală a indicatorului este împărțită în părți componente care corespund acțiunii fiecărui factor individual. Luați în considerare o serie de probleme pe care le rezolvă o analiză tipică a variației.
Exemplul 1
Atelierul are o serie de mașini-unelte - mașini automate care produc o anumită parte. Mărimea fiecărei părți este o valoare aleatorie, care depinde de setările fiecărei mașini și de abaterile aleatorii care apar în timpul fabricării pieselor.Este necesar să se stabilească dacă mașinile sunt configurate în mod egal în funcție de măsurătorile dimensiunilor pieselor.
Exemplul 2
În timpul fabricării aparatului electric se folosesc diferite tipuri de hârtie izolatoare: condensator, electric etc. Aparatul poate fi impregnat cu diverse substanțe: rășină epoxidică, lac, rășină ML-2, etc. Scurgerile pot fi eliminate sub vid la presiune ridicată, prin încălzire. Poate fi impregnat prin imersie în lac, sub un flux continuu de lac, etc. Aparatul electric în ansamblu este turnat cu un anumit compus, din care există mai multe opțiuni. Indicatorii de calitate sunt rezistența dielectrică a izolației, temperatura supraîncălzirii înfășurării în regim de funcționare și o serie de altele. În timpul testării procesului tehnologic al aparatelor de fabricație, este necesar să se determine modul în care fiecare dintre factorii enumerați afectează performanțele aparatului.
Exemplul 3
Depozitul troleibuzului servește mai multe rute de troleibuz. Pentru ele funcționează diverse tipuri de troleibuze, iar colectarea tarifelor este colectată de 125 de controlori. Managementul depozitului este interesat de întrebarea: cum se poate compara performanța economică a fiecărui controlor (venit), luând în considerare diferite rute, diferite tipuri de troleibuze? Cum se poate determina fezabilitatea economică a eliberării unui anumit tip de troleibuz pe o anumită rută? Cum să stabilim cerințe rezonabile pentru suma veniturilor pe care conductorul le aduce pe fiecare rută în diferite tipuri de troleibuze?
Sarcina alegerii unei metode este modul de a obține informațiile maxime privind impactul asupra rezultatului final al fiecărui factor, de a determina caracteristicile numerice ale unui astfel de efect, fiabilitatea acestora la cel mai mic cost și în cel mai scurt timp posibil. Rezolva astfel de probleme permit metode de analiză a variației.
Analiză unidirecțională
Studiul își propune să evalueze amploarea impactului unui anumit caz asupra analizei analizate. O altă sarcină a analizei unidirecționale poate fi compararea a două sau mai multe circumstanțe unele cu altele pentru a determina diferența efectului lor asupra recuperării. Dacă ipoteza nulă este respinsă, atunci următorul pas va fi evaluarea cantitativă și construirea intervalelor de încredere pentru caracteristicile obținute. În cazul în care ipoteză nulă nu poate fi aruncat, este de obicei acceptat și se trage o concluzie asupra esenței influenței.
Analiza univariate a varianței poate deveni un analog nonparametric al metodei de rang Kraskel-Wallis. A fost dezvoltat de matematicianul american William Kraskel și economistul Wilson Wallis în 1952. Acest criteriu a fost atribuit pentru a testa ipoteza nulă că efectele asupra eșantioanelor studiate sunt egale cu valori medii necunoscute, dar egale. Numărul de eșantioane trebuie să fie mai mult de două.
Criteriul Jonkhier (Jonkhier-Terpstra) a fost propus independent de matematicianul olandez T.J. Terpstrom în 1952 și de psihologul britanic E.R. Jonkhier în 1954. Este utilizat atunci când se știe dinainte că grupurile de rezultate disponibile sunt ordonate de creșterea influenței factorului studiat, care este măsurat pe o scară ordinală.
M - testul Bartlett, propus de statisticianul britanic Maurice Stevenson Bartlett în 1937, este utilizat pentru a testa ipoteza nulă privind egalitatea de variații a mai multor populații generale normale din care au fost prelevate probele studiate, având în general volume diferite (numărul fiecărui eșantion ar trebui să fie de cel puțin patru ).
G este testul Cochren, care a fost descoperit de americanul William Gemmel Cochren în 1941. Este utilizat pentru a testa ipoteza nulă că variațiile populațiilor generale normale sunt egale pentru eșantioanele independente de volum egal.
Criteriul nonparametric Levene, propus de matematicianul american Howard Levene în 1960, este o alternativă la criteriul Bartlett în condiții în care nu există siguranța că probele studiate se supun distribuției normale.
În 1974, statisticienii americani Morton B. Brown și Alan B. Forsyth au propus un test (criteriul Brown-Forsythe), care este oarecum diferit de criteriul Leuven.
Analiza cu doi factori
Analiza varianței în două sensuri este utilizată pentru eșantioanele distribuite normal distribuite. În practică, sunt utilizate adesea tabele complexe ale acestei metode, în special cele în care fiecare celulă conține un set de date (măsurători repetate) corespunzătoare valorilor nivelului fix. Dacă ipotezele necesare pentru aplicarea analizei în două sensuri a variației nu sunt îndeplinite, atunci se utilizează criteriul de rang neparametric de Friedman (Friedman, Kendall și Smith) elaborat de economistul american Milton Friedman la sfârșitul anului 1930. Acest criteriu este independent de tipul de distribuție.
Se presupune doar că distribuția cantităților este aceeași și continuă și sunt independente unele de altele. La testarea ipotezei nule, ieșirea este prezentată sub forma unei matrice dreptunghiulare în care rândurile corespund nivelurilor factorului B, iar coloanele corespund nivelurilor A. Fiecare celulă a tabelului (bloc) poate fi rezultatul măsurătorilor parametrilor pe un obiect sau pe un grup de obiecte la valori constante ale nivelurilor ambilor factori. . În acest caz, datele corespunzătoare sunt furnizate ca valori medii ale unui anumit parametru pentru toate măsurătorile sau obiectele probei studiate. Pentru a aplica criteriul datelor de ieșire, este necesar să treceți de la rezultatele măsurării directe la rangul lor. Clasamentul se realizează pentru fiecare rând separat, adică valorile sunt ordonate pentru fiecare valoare fixă.
Page Criterion (L-criterion), propus de statisticianul american E. B. Page în 1963, este destinat să testeze ipoteza nulă. Pentru eșantioane mari, se utilizează aproximarea paginii. Aceștia, sub rezerva realității ipotezelor nule corespunzătoare, se supun distribuției normale standard. În cazul în care rândurile tabelului sursă au aceleași valori, este necesar să se utilizeze rânduri medii. Mai mult decât atât, acuratețea concluziilor va fi mai rea, cu atât vor exista numere de astfel de coincidențe.
Q este criteriul Cochren propus de V. Cohren în 1937. Este utilizat în cazurile în care grupurile de subiecți omogeni sunt expuși la mai mult de doi și pentru care sunt posibile două răspunsuri - negativ condiționat (0) și condițional pozitiv (1) . Ipoteza nulă constă în efecte egale de influență. Analiza pe două direcții a variației face posibilă determinarea existenței efectelor de procesare, dar nu face posibilă stabilirea pentru care coloane există acest efect. Pentru a rezolva această problemă, se utilizează metoda ecuațiilor multiple Sheffe pentru eșantioane cuplate.
Analiza multivariate
Sarcina analizei multivariate a variației apare atunci când este necesar să se determine influența a două sau mai multe condiții asupra unei anumite variabile aleatorii. Studiul prevede prezența unei variabile aleatorii dependente, măsurată pe scara diferenței sau a relațiilor și a mai multor variabile independente, fiecare dintre acestea fiind exprimată în scara numelor sau în rang. Analiza datelor de varianță este o secțiune destul de dezvoltată a statisticilor matematice, care are o mulțime de opțiuni. Conceptul de cercetare este comun atât pentru un singur factor cât și pentru multi-factor. Esența sa este că variația totală este împărțită în componente, ceea ce corespunde unei anumite grupări de date. Fiecare grupare de date are propriul model.Aici vom avea în vedere doar dispozițiile de bază necesare pentru înțelegerea și utilizarea practică a opțiunilor sale cele mai utilizate.
Analiza varianței factorilor necesită o atitudine destul de atentă la colectarea și prezentarea datelor de intrare și, în special, la interpretarea rezultatelor. Spre deosebire de un factor, ale cărui rezultate pot fi plasate în mod arbitrar într-o anumită secvență, rezultatele în doi factori necesită o reprezentare mai complexă. O situație și mai dificilă apare atunci când există trei, patru sau mai multe circumstanțe. Din această cauză, mai mult de trei (patru) condiții sunt rareori incluse într-un model. Un exemplu este apariția rezonanței la o anumită valoare a capacității și inductanței cercului electric; manifestarea unei reacții chimice cu un anumit set de elemente din care este construit sistemul; apariția efectelor anomale în sisteme complexe cu o anumită coincidență de circumstanțe. Prezența interacțiunii poate schimba fundamental modelul sistemului și uneori poate duce la o regândire a naturii fenomenelor cu care experimentatorul se confruntă.
Analiza multivariată a varianței cu experimente repetate
Datele de măsurare pot fi adesea grupate nu de doi, ci de un număr mai mare de factori. Deci, dacă luăm în considerare analiza varianței duratei de funcționare a anvelopelor roților de troleibuz, ținând cont de circumstanțe (producătorul și traseul pe care sunt acționate anvelopele), atunci putem distinge anotimpul în care sunt puse în funcțiune anvelopele (și anume, funcționarea pe timp de iarnă și vară) ca o condiție separată. Drept urmare, vom avea sarcina unei metode cu trei factori.
Dacă există mai multe condiții, abordarea este aceeași ca în analiza cu doi factori. În toate cazurile, încearcă să simplifice modelul. Fenomenul interacțiunii a doi factori nu se manifestă atât de des și interacțiunea triplă se produce doar în cazuri excepționale. Acestea includ interacțiunea pentru care există informații anterioare și motive întemeiate pentru a o lua în considerare în model. Procesul de izolare a factorilor individuali și de luare în considerare a acestora este relativ simplu. Prin urmare, deseori există dorința de a evidenția mai multe circumstanțe. Acest lucru nu trebuie dus. Cu cât sunt mai multe condiții, cu atât modelul este mai puțin fiabil și cu atât este mai mare probabilitatea de eroare. Modelul în sine, care include un număr mare de variabile independente, devine suficient de dificil de interpretat și incomod pentru utilizarea practică.
Ideea generală de analiză a varianței
Analiza variației statisticilor este o metodă de obținere a rezultatelor observațiilor care depind de diverse circumstanțe simultan existente și de a evalua impactul acestora. O variabilă controlată care corespunde metodei de influențare a obiectului de studiu și într-o anumită perioadă de timp dobândește o anumită valoare se numește factor. Pot fi calitative și cantitative. Nivelurile de condiții cantitative dobândesc o anumită valoare pe o scară numerică. Exemple sunt temperatura, presiunea, cantitatea de substanță. Factorii calitativi sunt substanțe diferite, metode tehnologice diferite, dispozitive, materiale de umplere. Nivelurile lor corespund scării numelor.
Calitatea poate include, de asemenea, tipul materialului de ambalare, condițiile de depozitare a formei de dozare. De asemenea, este rațional să se atribuie gradul de măcinare a materiilor prime, compoziția fracțională a granulelor care au o importanță cantitativă, dar sunt greu de controlat dacă se utilizează o scală cantitativă. Numărul factorilor de calitate depinde de tipul de formă de dozare, precum și de proprietățile fizice și tehnologice ale substanțelor medicinale. De exemplu, tabletele pot fi obținute din substanțe cristaline prin compresie directă. În acest caz, este suficient să alegeți substanțele culisante și lubrifiante.
Exemple de factori calitativi pentru diferite tipuri de forme de dozare
- Tincturi. Compoziția extractantului, tipul extractorului, metoda de preparare a materiilor prime, metoda de producție, metoda de filtrare.
- Extracte (lichide, groase, uscate). Compoziția extractantului, metoda de extracție, tipul de instalație, metoda de îndepărtare a substanței extractive și de balast.
- Tablete. Compoziția excipienților, materialelor de umplutură, a dezintegranților, a lianților, a lubrifianților și a glianțelor. O metodă de producere de tablete, tip de echipament de procesare. Tipul de coajă și componentele sale, formatori de film, pigmenți, coloranți, plastifianți, solvenți.
- Soluții de injecție. Tipul de solvent, metoda de filtrare, natura stabilizatorilor și conservanților, condițiile de sterilizare, metoda de umplere a fiolelor.
- Supozitoare. Compoziția bazei de supozitoare, o metodă de a produce supozitoare, umpluturi, ambalaje.
- Unguent. Compoziția bazei, componentele structurale, metoda de preparare a unguentului, tipul de echipament, ambalajul.
- Capsule. Tipul materialului de coajă, metoda pentru producerea capsulelor, tipul plastifiantului, conservantului, colorantului.
- Alifii. Metoda de preparare, compoziția, tipul de echipament, tipul de emulgator.
- Suspendarea. Tipul de solvent, tipul stabilizatorului, metoda de dispersie.
Exemple de factori calitativi și nivelurile lor studiate în procesul de fabricație a tabletelor
- Praf de copt. Amidon de cartofi, argilă albă, un amestec de bicarbonat de sodiu cu acid citric, carbonat de bază de magneziu.
- Soluție de legare. Apa, pastă de amidon, sirop de zahăr, soluție de metil celuloză, soluție de hidroxipropil metil celuloză, soluție de polivinil pirolidonă, soluție de alcool polivinilic.
- Substanță de alunecare. Aerosil, amidon, talc.
- Filler. Zahăr, glucoză, lactoză, clorură de sodiu, fosfat de calciu.
- Lubrifiant. Acidul stearic, polietilenglicol, parafină.
Analiza modelelor de varianță în studiul competitivității statului
Unul dintre cele mai importante criterii de evaluare a stării de stat, care evaluează nivelul de bunăstare și dezvoltare socio-economică al acestuia, este competitivitatea, adică un set de proprietăți inerente economiei naționale, care determină capacitatea statului de a concura cu alte țări. Determinând locul și rolul statului pe piața globală, putem stabili o strategie clară de asigurare securitatea economică la nivel internațional, deoarece este cheia relațiilor pozitive dintre Rusia și toți actorii de pe piața mondială: investitori, creditori, guverne de stat.
Pentru a compara nivelul de competitivitate al țărilor, țările sunt clasificate folosind indicii complexi, care includ diverși indicatori ponderați. La baza acestor indici stau factorii cheie care afectează situația economică, politică etc. Un set de modele pentru studierea competitivității statului prevede utilizarea metodelor de analiză statistică multivariate (în special, analiza variației (statisticilor), modelării econometrice, luării deciziilor) și include următorii pași principali:
- Formarea unui sistem de indicatori-indicatori.
- Evaluarea și prognoza indicatorilor competitivității statului.
- Comparație de indicatori-indicatori ai competitivității statelor.
Acum luați în considerare conținutul modelelor fiecăreia dintre etapele acestui complex.
În prima etapă Cu ajutorul metodelor de studiu ale experților, se formează un set justificat de indicatori economici pentru evaluarea competitivității statului, ținând cont de specificul dezvoltării sale pe baza evaluărilor internaționale și a datelor de la departamentele de statistică care reflectă starea sistemului în ansamblu și procesele sale.Alegerea acestor indicatori este justificată de necesitatea selectării celor care sunt pe deplin din punct de vedere al practicii permit determinarea nivelului statului, atractivitatea investițională a acestuia și posibilitățile de localizare relativă a potențialelor și amenințărilor existente în viața reală.
Principalii indicatori-indicatori ai sistemelor internaționale de rating sunt indicii:
- Competitivitate globală (IGC).
- Libertatea economică (IES).
- Dezvoltare umană (HDI).
- Percepțiile corupției (IPC).
- Amenințări interne și externe.
- Potențialul influenței internaționale (IPMV).
A doua etapă Acesta prevede evaluarea și prognozarea indicatorilor competitivității statului în funcție de ratingurile internaționale pentru cele 139 de țări ale lumii studiate.
A treia etapă oferă o comparație a condițiilor de competitivitate ale statelor folosind metode analiza corelației și regresiei.
Folosind rezultatele studiului, este posibilă determinarea naturii proceselor în ansamblu și a componentelor individuale ale competitivității statului; testează ipoteza influenței factorilor și a relației lor cu adecvat nivel de semnificație.
Implementarea setului de modele propus va permite nu numai să evalueze situația actuală a nivelului competitivității și atractivității investiționale a statelor, dar și să analizeze punctele slabe ale managementului, să prevină erorile deciziilor incorecte și să prevină dezvoltarea unei crize în stat.