categorie
...

Analisi multivariata della varianza

L'analisi della varianza è un insieme di metodi statistici progettati per verificare le ipotesi sulla relazione tra alcuni segni e i fattori studiati, che non hanno una descrizione quantitativa, nonché per stabilire il grado di influenza dei fattori e la loro interazione. Nella letteratura specializzata viene spesso chiamato ANOVA (dal nome inglese Analysis of Variations). Questo metodo fu sviluppato per la prima volta da R. Fisher nel 1925.

Tipi e criteri di analisi della varianza

Questo metodo viene utilizzato per studiare la relazione tra attributi qualitativi (nominali) e una variabile quantitativa (continua). Infatti, verifica l'ipotesi che la media aritmetica di diversi campioni sia uguale. Pertanto, può essere considerato un criterio parametrico per confrontare i centri di più campioni contemporaneamente. Se si utilizza questo metodo per due campioni, i risultati dell'analisi della varianza saranno identici ai risultati del test t-student. Tuttavia, a differenza di altri criteri, questo studio ci consente di studiare il problema in modo più dettagliato.

Analisi della varianza

L'analisi della varianza nelle statistiche si basa sulla legge: la somma dei quadrati delle deviazioni del campione combinato è uguale alla somma dei quadrati delle deviazioni infragruppo e alla somma dei quadrati delle deviazioni intergruppo. Per lo studio, il test di Fisher viene utilizzato per stabilire il significato della differenza tra varianze intergruppo da varianze infragruppo. Tuttavia, per questo, i prerequisiti necessari sono la normale distribuzione e omoschedasticità (uguaglianza delle varianze) dei campioni. Distingue tra analisi della varianza unidimensionale (univariata) e multivariata (multivariata). Il primo considera la dipendenza della quantità studiata da un attributo, il secondo - immediatamente da molti, e consente anche di identificare la relazione tra loro.

fattori

I fattori sono chiamati circostanze controllate che influenzano il risultato finale. Il suo livello o metodo di elaborazione è chiamato il valore che caratterizza la manifestazione specifica di questa condizione. Questi numeri sono generalmente indicati in scala nominale o seriale. Spesso, i valori di output sono misurati in scale quantitative o ordinali. Quindi sorge il problema di raggruppare i dati di output in una serie di osservazioni, che corrispondono approssimativamente agli stessi valori numerici. Se si ritiene che il numero di gruppi sia eccessivamente elevato, il numero di osservazioni in essi contenute potrebbe essere insufficiente per ottenere risultati affidabili. Se si prende un numero troppo piccolo, ciò può portare alla perdita di funzionalità significative dell'impatto sul sistema. Il modo specifico di raggruppare i dati dipende dal volume e dalla natura della variazione dei valori. Il numero e le dimensioni degli intervalli nell'analisi unidirezionale sono spesso determinati dal principio di intervalli uguali o dal principio di frequenze uguali.

Analisi dei problemi di varianza

Quindi, ci sono casi in cui è necessario confrontare due o più campioni. È quindi consigliabile l'uso dell'analisi della varianza. Il nome del metodo indica che le conclusioni sono tratte dallo studio dei componenti della varianza. L'essenza dello studio è che il cambiamento generale dell'indicatore è diviso in parti componenti che corrispondono all'azione di ogni singolo fattore. Considera una serie di problemi risolti da un'analisi tipica della varianza.

Esempio 1

L'officina ha una serie di macchine utensili - macchine automatiche che producono una parte specifica. La dimensione di ogni parte è un valore casuale, che dipende dalle impostazioni di ciascuna macchina e dalle deviazioni casuali che si verificano durante la fabbricazione delle parti.È necessario determinare se le macchine sono ugualmente configurate in base alle misure delle dimensioni delle parti.

analisi dei metodi di varianza

Esempio 2

Durante la fabbricazione dell'apparato elettrico, vengono utilizzati vari tipi di carta isolante: condensatore, elettrico, ecc. L'apparecchio può essere impregnato di varie sostanze: resina epossidica, vernice, resina ML-2, ecc. Le perdite possono essere eliminate sotto vuoto ad alta pressione, mediante riscaldamento. Può essere impregnato per immersione in vernice, sotto un flusso continuo di vernice, ecc. L'apparato elettrico nel suo insieme viene versato con un certo composto, di cui esistono diverse opzioni. Gli indicatori di qualità sono la rigidità dielettrica dell'isolamento, la temperatura del surriscaldamento dell'avvolgimento in modalità operativa e molti altri. Durante il test del processo tecnologico di fabbricazione di apparecchi, è necessario determinare in che modo ciascuno dei fattori elencati influisce sulle prestazioni dell'apparato.

Esempio 3

Il deposito di filobus serve diverse linee di filobus. Vari tipi di filobus funzionano per loro e la raccolta delle tariffe viene raccolta da 125 controllori. La gestione del deposito è interessata alla domanda: come confrontare le prestazioni economiche di ciascun controllore (entrate) tenendo conto di percorsi diversi, diversi tipi di filobus? Come determinare la fattibilità economica del rilascio di un particolare tipo di filobus su un determinato percorso? Come stabilire requisiti ragionevoli per l'ammontare delle entrate che il conduttore porta su ciascuna rotta in diversi tipi di filobus?

Il compito di scegliere un metodo è come ottenere le massime informazioni sull'impatto sul risultato finale di ciascun fattore, per determinare le caratteristiche numeriche di tale effetto, la loro affidabilità al minor costo e nel minor tempo possibile. Risolvere tali problemi consente metodi di analisi della varianza.

Analisi a senso unico

Lo studio mira a valutare l'entità dell'impatto di un caso particolare sulla revisione analizzata. Un altro compito dell'analisi unidirezionale potrebbe essere quello di confrontare due o più circostanze tra loro al fine di determinare la differenza nel loro effetto sul richiamo. Se l'ipotesi nulla viene respinta, il passaggio successivo sarà la valutazione quantitativa e la costruzione di intervalli di confidenza per le caratteristiche ottenute. Nel caso in cui ipotesi nulla non può essere scartato, di solito è accettato e si trae una conclusione sull'essenza dell'influenza.

L'analisi univariata della varianza può diventare un analogo non parametrico del metodo di rango di Kraskel-Wallis. È stato sviluppato dal matematico americano William Kraskel e dall'economista Wilson Wallis nel 1952. Questo criterio è stato assegnato per testare l'ipotesi nulla che gli effetti sui campioni studiati siano uguali a valori medi sconosciuti ma uguali. Il numero di campioni dovrebbe essere superiore a due.

analisi delle statistiche di varianza

Il criterio di Jonkhier (Jonkhier-Terpstra) fu proposto indipendentemente dal matematico olandese T.J. Terpstrom nel 1952 e dallo psicologo britannico E.R. Jonkhier nel 1954. Viene usato quando è noto in anticipo che i gruppi di risultati disponibili sono ordinati da la crescita dell'influenza del fattore studiato, che viene misurata su scala ordinale.

M - il test di Bartlett, proposto dallo statistico britannico Maurice Stevenson Bartlett nel 1937, viene utilizzato per testare l'ipotesi nulla sull'uguaglianza delle varianze di diverse popolazioni generali normali da cui sono stati prelevati i campioni studiati, generalmente con volumi diversi (il numero di ciascun campione dovrebbe essere almeno quattro ).

G è il test di Cochren, scoperto dall'americano William Gemmel Cochren nel 1941. Viene utilizzato per verificare l'ipotesi nulla che le varianze delle popolazioni generali normali siano uguali per campioni indipendenti di uguale volume.

Il criterio non parametrico di Levene, proposto dal matematico americano Howard Levene nel 1960, è un'alternativa al criterio di Bartlett in condizioni in cui non vi è certezza che i campioni studiati obbediscano alla normale distribuzione.

Nel 1974, gli statistici americani Morton B. Brown e Alan B. Forsyth hanno proposto un test (criterio Brown-Forsythe), che è in qualche modo diverso dal criterio di Lovanio.

Analisi a due fattori

L'analisi bidirezionale della varianza viene utilizzata per campioni accoppiati normalmente distribuiti. In pratica, vengono spesso utilizzate tabelle complesse di questo metodo, in particolare quelle in cui ogni cella contiene un insieme di dati (misurazioni ripetute) corrispondenti a valori di livello fissi. Se le ipotesi necessarie per l'applicazione dell'analisi bidirezionale della varianza non sono soddisfatte, viene utilizzato il criterio non parametrico di rango di Friedman (Friedman, Kendall e Smith) sviluppato dall'economista americano Milton Friedman alla fine del 1930. Questo criterio è indipendente dal tipo di distribuzione.

Si presume solo che la distribuzione delle quantità sia uguale e continua e siano indipendenti l'una dall'altra. Quando si verifica l'ipotesi nulla, l'output viene presentato sotto forma di una matrice rettangolare in cui le righe corrispondono ai livelli del fattore B e le colonne corrispondono ai livelli di A. Ogni cella della tabella (blocco) può essere il risultato di misurazioni di parametri su un oggetto o su un gruppo di oggetti a valori costanti dei livelli di entrambi i fattori . In questo caso, i dati corrispondenti vengono forniti come valori medi di un determinato parametro per tutte le misurazioni o gli oggetti del campione studiato. Per applicare il criterio dei dati di output, è necessario passare dai risultati della misurazione diretta al loro grado. La classifica viene eseguita separatamente per ogni riga, ovvero i valori vengono ordinati per ciascun valore fisso.

analisi della varianza nelle statistiche

Il criterio di pagina (criterio di L), proposto dallo statistico americano E. B. Page nel 1963, ha lo scopo di verificare l'ipotesi nulla. Per campioni di grandi dimensioni, viene utilizzata l'approssimazione della pagina. Essi, soggetti alla realtà delle corrispondenti ipotesi nulle, obbediscono alla normale distribuzione normale. Nel caso in cui le righe della tabella di origine abbiano gli stessi valori, è necessario utilizzare i ranghi medi. Inoltre, l'accuratezza delle conclusioni sarà peggiore, maggiore sarà il numero di tali coincidenze.

Q è il criterio di Cochren proposto da V. Cohren nel 1937. È usato nei casi in cui gruppi di soggetti omogenei sono esposti a più di due e per i quali sono possibili due risposte: condizionatamente negativo (0) e condizionatamente positivo (1) . L'ipotesi nulla consiste in uguali effetti di influenza. L'analisi bidirezionale della varianza consente di determinare l'esistenza di effetti di elaborazione, ma non consente di stabilire per quali colonne esiste questo effetto. Per risolvere questo problema, viene utilizzato il metodo di più equazioni di Sheffe per campioni accoppiati.

Analisi multivariata

Il compito dell'analisi multivariata della varianza sorge quando è necessario determinare l'influenza di due o più condizioni su una determinata variabile casuale. Lo studio prevede la presenza di una variabile casuale dipendente, misurata sulla scala della differenza o delle relazioni, e diverse variabili indipendenti, ognuna delle quali è espressa nella scala dei nomi o nella classifica. L'analisi dei dati di varianza è una sezione abbastanza sviluppata delle statistiche matematiche, che ha molte opzioni. Il concetto di ricerca è comune sia a fattore singolo che a fattore multiplo. La sua essenza è che la varianza totale è divisa in componenti, che corrisponde a un determinato raggruppamento di dati. Ogni raggruppamento di dati ha il suo modello.Qui considereremo solo le disposizioni di base necessarie per la comprensione e l'uso pratico delle sue opzioni più utilizzate.

analisi unidirezionale della varianza

L'analisi della varianza dei fattori richiede un atteggiamento piuttosto attento alla raccolta e alla presentazione dei dati di input, e in particolare all'interpretazione dei risultati. A differenza di un fattore, i cui risultati possono essere arbitrariamente inseriti in una determinata sequenza, i risultati a due fattori richiedono una rappresentazione più complessa. Una situazione ancora più difficile si presenta quando ci sono tre, quattro o più circostanze. Per questo motivo, più di tre (quattro) condizioni sono raramente incluse in un modello. Un esempio è il verificarsi della risonanza a un certo valore della capacità e dell'induttanza del cerchio elettrico; la manifestazione di una reazione chimica con un certo insieme di elementi da cui è costruito il sistema; il verificarsi di effetti anomali in sistemi complessi con una certa coincidenza di circostanze. La presenza di interazione può cambiare radicalmente il modello del sistema e talvolta portare a un ripensamento della natura dei fenomeni con cui lo sperimentatore sta affrontando.

Analisi multivariata della varianza con esperimenti ripetuti

I dati di misurazione possono spesso essere raggruppati non per due, ma per un numero maggiore di fattori. Quindi, se consideriamo l'analisi della varianza della durata dei pneumatici delle ruote del filobus tenendo conto delle circostanze (il produttore e il percorso su cui vengono azionati i pneumatici), allora possiamo distinguere la stagione durante la quale i pneumatici (vale a dire, il funzionamento invernale ed estivo) come una condizione separata. Di conseguenza, avremo il compito di un metodo a tre fattori.

Se ci sono più condizioni, l'approccio è lo stesso dell'analisi a due fattori. In tutti i casi, cercano di semplificare il modello. Il fenomeno dell'interazione di due fattori non si manifesta così spesso e l'interazione tripla si verifica solo in casi eccezionali. Includono l'interazione per la quale esistono informazioni precedenti e buoni motivi per tenerne conto nel modello. Il processo di isolamento dei singoli fattori e di considerarli è relativamente semplice. Pertanto, spesso c'è il desiderio di evidenziare più circostanze. Questo non dovrebbe essere portato via. Più condizioni, meno affidabile diventa il modello e maggiore è la probabilità di errore. Il modello stesso, che include un gran numero di variabili indipendenti, diventa abbastanza difficile da interpretare e scomodo per un uso pratico.

L'idea generale di analisi della varianza

L'analisi della varianza nelle statistiche è un metodo per ottenere i risultati di osservazioni che dipendono da varie circostanze contemporaneamente esistenti e per valutarne l'impatto. Una variabile controllata che corrisponde al metodo di influenza dell'oggetto di studio e che in un determinato periodo di tempo acquisisce un certo valore viene chiamata fattore. Possono essere qualitativi e quantitativi. I livelli di condizioni quantitative acquisiscono un certo valore su una scala numerica. Esempi sono temperatura, pressione, quantità di sostanza. I fattori qualitativi sono diverse sostanze, diversi metodi tecnologici, dispositivi, riempitivi. I loro livelli corrispondono alla scala dei nomi.

analisi della varianza

La qualità può anche includere il tipo di materiale di imballaggio, le condizioni di conservazione del modulo di dosaggio. È anche razionale attribuire il grado di macinazione delle materie prime, la composizione frazionata dei granuli che sono di importanza quantitativa, ma che sono difficili da controllare se si utilizza una scala quantitativa. Il numero di fattori di qualità dipende dal tipo di forma di dosaggio, nonché dalle proprietà fisiche e tecnologiche delle sostanze medicinali. Ad esempio, le compresse possono essere ottenute da sostanze cristalline mediante compressione diretta. In questo caso, è sufficiente fare una scelta di sostanze scivolanti e lubrificanti.

Esempi di fattori qualitativi per vari tipi di forme di dosaggio

  • Tinture. La composizione dell'estrattore, il tipo di estrattore, il metodo di preparazione delle materie prime, il metodo di produzione, il metodo di filtraggio.
  • Estratti (liquido, denso, secco). La composizione dell'estrattore, il metodo di estrazione, il tipo di installazione, il metodo di rimozione dell'estrattore e delle sostanze di zavorra.
  • Compresse. La composizione di eccipienti, filler, disintegranti, leganti, lubrificanti e glidanti. Un metodo di produzione di compresse, tipo di apparecchiatura di elaborazione. Tipo di guscio e suoi componenti, formatori di film, pigmenti, coloranti, plastificanti, solventi.
  • Soluzioni di iniezione. Tipo di solvente, metodo di filtrazione, natura degli stabilizzanti e conservanti, condizioni di sterilizzazione, metodo di riempimento delle fiale.
  • Supposte. La composizione della base della supposta, un metodo per produrre supposte, riempitivi, imballaggi.
  • Unguento. La composizione della base, i componenti strutturali, il metodo di preparazione dell'unguento, il tipo di attrezzatura, l'imballaggio.
  • Capsule. Tipo di materiale del guscio, metodo per la produzione di capsule, tipo di plastificante, conservante, colorante.
  • Unguenti. Il metodo di preparazione, composizione, tipo di apparecchiatura, tipo di emulsionante.
  • Sospensione. Tipo di solvente, tipo di stabilizzante, metodo di dispersione.

Esempi di fattori qualitativi e dei loro livelli studiati nel processo di fabbricazione di compresse

  • Lievito in polvere. Fecola di patate, argilla bianca, una miscela di bicarbonato di sodio con acido citrico, carbonato di magnesio di base.
  • Soluzione vincolante. Acqua, pasta di amido, sciroppo di zucchero, soluzione di metilcellulosa, soluzione di idrossipropilmetilcellulosa, soluzione di polivinil pirrolidone, soluzione di alcol polivinilico.
  • Sostanza scivolante. Aerosil, amido, talco.
  • Filler. Zucchero, glucosio, lattosio, cloruro di sodio, fosfato di calcio.
  • Lubrificante. Acido stearico, polietilenglicole, paraffina.

Analisi dei modelli di varianza nello studio della competitività statale

Uno dei criteri più importanti per la valutazione dello stato dello stato, che valuta il livello di benessere e sviluppo socio-economico, è la competitività, ovvero un insieme di proprietà inerenti all'economia nazionale, che determinano la capacità dello stato di competere con altri paesi. Dopo aver determinato la posizione e il ruolo dello stato nel mercato globale, possiamo stabilire una chiara strategia per garantire sicurezza economica a livello internazionale, perché è la chiave per relazioni positive tra la Russia e tutti gli attori del mercato mondiale: investitori, creditori, governi statali.

Per confrontare il livello di competitività dei paesi, i paesi sono classificati utilizzando indici complessi, che includono vari indicatori ponderati. La base di questi indici è i fattori chiave che influenzano la situazione economica, politica, ecc. Una serie di modelli per lo studio della competitività dello stato prevede l'uso di metodi di analisi statistica multivariata (in particolare, analisi della varianza (statistica), modellizzazione econometrica, processo decisionale) e comprende le seguenti fasi principali:

  1. Formazione di un sistema di indicatori-indicatori.
  2. Valutazione e previsione di indicatori di competitività statale.
  3. Confronto di indicatori-indicatori della competitività degli Stati.

Ora considera il contenuto dei modelli di ciascuna delle fasi di questo complesso.

Nel primo stadio Con l'aiuto di metodi di studio di esperti, viene formata una serie giustificata di indicatori-indicatori economici per valutare la competitività dello stato tenendo conto delle specificità del suo sviluppo basate su valutazioni internazionali e dati dei dipartimenti statistici che riflettono lo stato del sistema nel suo insieme e i suoi processi.La scelta di questi indicatori è giustificata dalla necessità di selezionare quelli che più pienamente dal punto di vista pratico consentono di determinare il livello dello stato, la sua attrattiva per gli investimenti e le possibilità di localizzazione relativa delle potenziali minacce esistenti e della vita reale.

analisi dei dati di varianza

I principali indicatori-indicatori dei sistemi di rating internazionali sono gli indici:

  1. Competitività globale (CIG).
  2. Libertà economica (IES).
  3. Sviluppo umano (HDI).
  4. Percezioni di corruzione (CPI).
  5. Minacce interne ed esterne.
  6. Il potenziale di influenza internazionale (IPMV).

Secondo stadio Prevede la valutazione e la previsione di indicatori di competitività statale secondo i rating internazionali per i 139 paesi del mondo studiati.

Terza fase fornisce un confronto della competitività degli stati usando metodi analisi di correlazione e regressione.

Utilizzando i risultati dello studio, è possibile determinare la natura dei processi nel loro insieme e dai singoli componenti della competitività dello stato; verificare l'ipotesi dell'influenza dei fattori e il loro rapporto con appropriato livello di significatività.

L'attuazione della serie di modelli proposti consentirà non solo di valutare la situazione attuale del livello di competitività e attrattiva degli investimenti degli Stati, ma anche di analizzare i punti deboli della gestione, prevenire errori di decisioni errate e prevenire lo sviluppo di una crisi nello stato.


1 commento
Mostra:
nuovo
nuovo
popolare
discusso
×
×
Sei sicuro di voler eliminare il commento?
cancellare
×
Motivo del reclamo
Avatar
SPSS
Problemi importanti che sorgono quando si interpretano i risultati dell'analisi della varianza sono le interazioni, l'importanza relativa dei fattori e confronti multipli.
risposta
0

affari

Storie di successo

attrezzatura