Anàlisi de la covariància

L'anàlisi de la covariància o ANCOVA, acrònim de l'anglès analysis of covariance, és un model lineal general amb una variable quantitativa i un o més factors. El ANCOVA és una fusió del ANOVA i de la regressió lineal múltiple. És un procediment estadístic que permet eliminar l'heterogeneïtat causada en la variable d'interès (variable dependent) per la influència d'una o més variables quantitatives (covariables). Bàsicament, el fonament del ANCOVA és un ANOVA a qui a la variable dependent se li ha eliminat l'efecte predit per una o més covariables per regressió lineal múltiple. La inclusió de covariables pot augmentar la potència estadística perquè sovint redueix la variabilitat.

Equacions

ANCOVA d'un factor

L'anàlisi d'un factor és apropiat quan es disposa de tres o més grups; k grups. El factor (variable categòrica) té k nivells. En els dissenys equilibrats, cada grup té el mateix nombre de dades (individus), els quals idealment han estat assignats a l'atzar a cada grup a partir d'una mostra original preferiblement homogènia.

Calculant la suma de les desviacions al quadrat per a la variable independent X i la variable dependent Y

La suma de les desviacions al quadrat (SS): S S T y {\displaystyle SST_{y}} , S S T r y {\displaystyle SSTr_{y}} , i S S E y {\displaystyle SSE_{y}} ha de ser calculada usant les següents equacions per a la variable dependent, Y . La SS per la covariància també ha de ser calculada, els dos valors necessaris són S S T x {\displaystyle SST_{x}} i S S E x {\displaystyle SSE_{x}} .

La suma de quadrats total defineix una la variabilitat del total d'individus n T {\displaystyle n_{T}} :

S S T y = i = 1 n j = 1 k Y i j 2 ( i = 1 n j = 1 k Y i j ) 2 n T {\displaystyle SST_{y}=\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}^{2}-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)^{2}}{n_{T}}}}

La suma de quadrats per als tractaments defineix la variabilitat entre les poblacions o grups. n k {\displaystyle n_{k}} representa el nombre de grups.

S S T r y = i = 1 n ( j = 1 k Y i j 2 n k ) ( i = 1 n j = 1 k Y i j ) 2 n T {\displaystyle SSTr_{y}=\sum _{i=1}^{n}\left({\frac {\sum _{j=1}^{k}Y_{ij}^{2}}{n_{k}}}\right)-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)^{2}}{n_{T}}}}

La suma de quadrats de l'error defineix la variabilitat residual dins de cada grup. n n {\displaystyle n_{n}} representa el nombre d'individus en un grup donat:

S S E y = i = 1 n j = 1 k Y i j 2 i = 1 n ( j = 1 k Y i j 2 n k ) {\displaystyle SSE_{y}=\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}^{2}-\sum _{i=1}^{n}\left({\frac {\sum _{j=1}^{k}Y_{ij}^{2}}{n_{k}}}\right)}

La suma de quadrats total és igual a la suma de quadrats dels tractaments i la suma de quadrats de l'error (propietat d'additivitat de les sumes de quadrats i dels graus de llibertat, característica de l'ANOVA).

S S T y = S S T r y + S S E y . {\displaystyle SST_{y}=SSTr_{y}+SSE_{y}.\,}

Càlcul de la covariància de X i Y

La suma de les covariàncies defineix la covariància de X i Y .

S C T = i = 1 n j = 1 k X i j Y i j ( i = 1 n j = 1 k X i j ) ( i = 1 n j = 1 k Y i j ) n T {\displaystyle SCT=\sum _{i=1}^{n}\sum _{j=1}^{k}X_{ij}Y_{ij}-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}X_{ij}\right)\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)}{n_{T}}}}
S C E = j = 1 k ( i = 1 n X i j Y i j i = 1 n ( x i j Y i j ) n n ) {\displaystyle SCE=\sum _{j=1}^{k}\left(\sum _{i=1}^{n}X_{ij}Y_{ij}-{\frac {\sum _{i=1}^{n}(x_{ij}Y_{ij})}{n_{n}}}\right)}

Ajust de SST i

La correlació entre X i Y és r T 2 {\displaystyle r_{T}^{2}} .

R T 2 = S C T 2 S S T x S S T y {\displaystyle R_{T}^{2}={\frac {SCT^{2}}{SST_{x}SST_{y}}}}
R n 2 = S C E 2 S S E x S S E y {\displaystyle R_{n}^{2}={\frac {SCE^{2}}{SSE_{x}SSE_{y}}}}

La proporció de covariància és sostreta de la dependent, valors de S S y {\displaystyle SS_{y}} :

S S T y a d j = S S T y r T 2 {\displaystyle SST_{yadj}=SST_{y}-r_{T}^{2}\,}
S S E y a d j = S S E y r n 2 {\displaystyle SSE_{yadj}=SSE_{y}-r_{n}^{2}\,}
S S T r y a d j = S S T y a d j S S E y a d j {\displaystyle SSTr_{yadj}=SST_{yadj}-SSE_{yadj}\,}

Ajust de les mitjanes de cada grup k

La mitjana de cada grup és ajustada de la manera següent:

M y i a d j = m y i S C E y S C E x ( m x i m x T ) {\displaystyle M_{y_{i}adj}=m_{y_{i}}-{\frac {SCE_{y}}{SCE_{x}}}(m_{x_{i}}-m_{x_{T}})}

Anàlisi usant els valors de la suma de quadrats

Finalment obtenim la variància dels tractaments lliure de la covariància, on d f T r {\displaystyle df_{Tr}} (graus de llibertat) és igual a N T k 1 {\displaystyle N_{T}-k-1} . Pot apreciar que cada covariable elimina un grau de llibertat.

M S T r = S S T r d f T r {\displaystyle MSTr={\frac {SSTr}{df_{Tr}}}}
M S E = S S E d f E {\displaystyle MSE={\frac {SSE}{df_{E}}}}

E estadístic F és:

F d f E , d f T r = M S T r M S E . {\displaystyle F_{df_{E},df_{\mathrm {Tr} }}={\frac {\mathrm {MSTr} }{\mathrm {MSE} }}.}

Enllaços externs (anglès)

  • One-Way Analysis of Covariance for Yndependent Samples Arxivat 2005-11-24 a Wayback Machine.