Model liniar

În statistică termenul model liniar[1] este folosit în diferite moduri, în funcție de context. Cea mai frecventă apariție este în legătură cu modelele de regresie, iar termenul este adesea considerat sinonim cu modelul de regresie liniară. Totuși, termenul este folosit și în analiza seriilor temporale, cu un înțeles diferit. În fiecare caz, denumirea de liniară este utilizată pentru a identifica o subclasă de modele pentru care este posibilă o reducere substanțială a complexității teoriei aferente din statistică.

Modele de regresie liniară

Articol principal: Regresie liniară.

În cazul regresiei, modelul statistic⁠(d) este după cum urmează. Fiind dat un eșantion (aleatoriu) ( Y i , X i 1 , , X i p ) , i = 1 , , n {\displaystyle (Y_{i},X_{i1},\ldots ,X_{ip}),\,i=1,\ldots ,n} relația dintre observațiile Y i {\displaystyle Y_{i}} și variabilele independente⁠(d) X i j {\displaystyle X_{ij}} este formulată astfel:

Y i = β 0 + β 1 ϕ 1 ( X i 1 ) + + β p ϕ p ( X i p ) + ε i i = 1 , , n {\displaystyle Y_{i}=\beta _{0}+\beta _{1}\phi _{1}(X_{i1})+\cdots +\beta _{p}\phi _{p}(X_{ip})+\varepsilon _{i}\qquad i=1,\ldots ,n}

unde ϕ 1 , , ϕ p {\displaystyle \phi _{1},\ldots ,\phi _{p}} pot fi funcții neliniare⁠(d). În relația de mai sus, mărimile ε i {\displaystyle \varepsilon _{i}} sunt variabile aleatoare reprezentând erori. Partea „liniară” a desemnării se referă la apariția în relația de mai sus a coeficienților de regresie, β j {\displaystyle \beta _{j}} într-un mod liniar. Alternativ, se poate spune că valorile prezise corespund modelului de mai sus, anume

Y ^ i = β 0 + β 1 ϕ 1 ( X i 1 ) + + β p ϕ p ( X i p ) ( i = 1 , , n ) , {\displaystyle {\hat {Y}}_{i}=\beta _{0}+\beta _{1}\phi _{1}(X_{i1})+\cdots +\beta _{p}\phi _{p}(X_{ip})\qquad (i=1,\ldots ,n),}

sunt funcții liniare de β j {\displaystyle \beta _{j}} .

Având în vedere că estimarea este efectuată pe baza unei analize prin metoda celor mai mici pătrate, estimările parametrilor necunoscuți β j {\displaystyle \beta _{j}} sunt determinate prin reducerea la minimum a funcției sumă a pătratelor

S = i = 1 n ( Y i β 0 β 1 ϕ 1 ( X i 1 ) β p ϕ p ( X i p ) ) 2 . {\displaystyle S=\sum _{i=1}^{n}\left(Y_{i}-\beta _{0}-\beta _{1}\phi _{1}(X_{i1})-\cdots -\beta _{p}\phi _{p}(X_{ip})\right)^{2}.}

Din aceasta se poate observa cu ușurință că aspectul „liniar” al modelului înseamnă următoarele:

  • funcția de minimizat este o funcție algebrică de gradul al doilea de β j {\displaystyle \beta _{j}} pentru care minimizarea este o problemă relativ simplă;
  • derivatele funcției sunt funcții liniare ale β j {\displaystyle \beta _{j}} , ceea ce face ușoară găsirea valorilor de minimizare;
  • valorile de minimizare β j {\displaystyle \beta _{j}} sunt funcții liniare de mărimile observate Y i {\displaystyle Y_{i}} ;
  • valorile de minimizare β j {\displaystyle \beta _{j}} sunt funcții liniare de erorilor aleatoare ε i {\displaystyle \varepsilon _{i}} ceea ce face relativ ușor să se determine proprietățile statistice ale valorilor estimate ale β j {\displaystyle \beta _{j}} .

Modele de serii temporale

La un model de serie temporală liniară valorile { X t {\displaystyle X_{t}} } dintr-o serie temporală pot fi scrise sub forma

X t = c + ε t + i = 1 p ϕ i X t i + i = 1 q θ i ε t i . {\displaystyle X_{t}=c+\varepsilon _{t}+\sum _{i=1}^{p}\phi _{i}X_{t-i}+\sum _{i=1}^{q}\theta _{i}\varepsilon _{t-i}.}

unde din nou mărimile ε i {\displaystyle \varepsilon _{i}} sunt variabile aleatoare noi care apar la un anumit moment de timp, dar afectează și valorile lui X {\displaystyle X} în momente ulterioare. În acest caz, utilizarea termenului „model liniar” se referă la structura relației de mai sus în reprezentarea X t {\displaystyle X_{t}} ca o funcție liniară a valorilor trecute ale aceleiași serii de timp și a valorilor curente și trecute ale celor noi.[2] Acest aspect particular al structurii înseamnă că este relativ simplu să se obțină relațiile pentru proprietățile de medie și covarianță ale seriei temporale. De reținut că aici partea „liniară” a termenului „model liniar” nu se referă la coeficienții ϕ i {\displaystyle \phi _{i}} și θ i {\displaystyle \theta _{i}} , așa cum ar fi în cazul unui model de regresie, care, structural, arată similar.

Alte aspecte

Termenul de „model neliniar” este folosit de obicei în contrast cu un model structurat liniar. În caz că nu există ambiguitate, precizarea „model liniar” nu se mai face.

Note

  1. ^ Matematici speciale (curs, Probabilități și statistică, p. 255), Universitatea Politehnica din București, accesat 2023-07-21
  2. ^ en Priestley, M.B. (1988) Non-linear and Non-stationary time series analysis, Academic Press. ISBN: 0-12-564911-8

Vezi și

  • Regresie liniară
Portal icon Portal Matematică
Control de autoritate
  • BNF: cb119666602 (data)
  • GND: 4134827-8
  • LCCN: sh85077177
  • NKC: ph1175217