Spektraldichteschätzung

Die Spektraldichte eines stationären stochastischen Prozesses erlaubt tiefe Einblicke in die Struktur des Prozesses, insbesondere wenn es sich um Erkenntnisse über Periodizitäten handelt. Es ist also wichtig, dass aus gegebenen Daten, z. B. einer konkreten Zeitreihe, die Spektraldichte gut geschätzt werden kann.

Grundlage der meisten Schätzer ist das Periodogramm, das auf Arthur Schuster 1898 zurückgeht.[1]

Definitionen

Spektraldichte

Sei X t ; t Z {\displaystyle X_{t};t\in \mathbb {Z} } ( Z {\displaystyle \mathbb {Z} } die Menge der ganzen Zahlen) ein (evtl. komplexwertiger) stationärer stochastischer Prozess mit

  • Erwartungswert E X t = 0 {\displaystyle \operatorname {E} X_{t}=0}
  • Kovarianzfunktion E X t X t + h = γ ( h ) {\displaystyle \operatorname {E} X_{t}X_{t+h}=\gamma (h)} .

Falls h = | γ ( h ) | < {\displaystyle \textstyle \sum _{h=-\infty }^{\infty }|\gamma (h)|<\infty } , gilt die Spektraldarstellung von γ ( h ) {\displaystyle \gamma (h)} :

γ ( h ) = π π f ( λ ) e i h λ d λ m i t f ( λ ) = 1 2 π h = e i h λ γ ( h ) {\displaystyle \gamma (h)=\int _{-\pi }^{\pi }f(\lambda )\,e^{ih\lambda }\,d\lambda \quad \mathrm {mit} \quad f(\lambda )={\frac {1}{2\pi }}\sum _{h=-\infty }^{\infty }e^{-ih\lambda }\,\gamma (h)} .

Die Funktion f {\displaystyle f} heißt Spektraldichte. Ihr Funktionswert f ( λ ) {\displaystyle f(\lambda )} gibt die Intensität der Frequenz λ {\displaystyle \lambda } im Spektrum von X t {\displaystyle X_{t}} an.

Periodogramm

Seien x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}} Realisierungen eines stationären stochastischen Prozesses X t {\displaystyle X_{t}} mit E X t = 0 {\displaystyle \operatorname {E} X_{t}=0} . Dann heißt der Ausdruck

I n ( λ ) := 1 2 π n | k = 1 n x k e i λ k | 2 {\displaystyle I_{n}(\lambda ):={\frac {1}{2\pi n}}\left|\sum _{k=1}^{n}x_{k}\,e^{-i\lambda k}\right|^{2}}

Periodogramm der konkreten Zeitreihe x 1 , , x n {\displaystyle x_{1},\dots ,x_{n}} .

Schätzungen der Spektraldichte

Inkonsistente Schätzungen

Man kann das Periodogramm umformen in

I n ( λ ) = 1 2 π k = ( n 1 ) n 1 e i λ k γ ^ ( k ) ;   γ ^ ( k ) = 1 n t = 1 n k x t + k x t {\displaystyle I_{n}(\lambda )={\frac {1}{2\pi }}\sum _{k=-(n-1)}^{n-1}e^{-i\lambda k}{\hat {\gamma }}(k);\ {\hat {\gamma }}(k)={\frac {1}{n}}\sum _{t=1}^{n-k}x_{t+k}x_{t}} .

I n ( λ ) {\displaystyle I_{n}(\lambda )} erweist sich also als die (empirische) Fouriertransformierte der empirischen Kovarianzfunktion γ ^ ( k ) {\displaystyle {\hat {\gamma }}(k)} . Da f ( λ ) {\displaystyle f(\lambda )} die Fouriertransformierte von γ ( h ) {\displaystyle \gamma (h)} ist, kann man heuristisch erwarten, dass I n ( λ ) {\displaystyle I_{n}(\lambda )} eine geeignete Schätzung für f ( λ ) {\displaystyle f(\lambda )} darstellt. Tatsächlich ist das Periodogramm eine asymptotisch erwartungstreue Schätzung der Spektraldichte, allerdings ist sie nicht konsistent,[2] d. h. in unmodifizierter Form nur eingeschränkt geeignet zur Schätzung der Spektraldichte.

Konsistente Schätzungen

Erwartungstreue und konsistente Schätzungen für f ( λ ) {\displaystyle f(\lambda )} erzeugt man durch geeignete gewichtete Mittel von I n ( λ ) {\displaystyle I_{n}(\lambda ^{\prime })} aus einer geeigneten Umgebung von λ {\displaystyle \lambda } .[3] Eine allgemeine Darstellung dafür ist

f ^ n ( λ ) = 1 2 π π π W n ( ν ) I n ( λ ν ) d ν {\displaystyle {\hat {f}}_{n}(\lambda )={\tfrac {1}{2\pi }}\int _{-\pi }^{\pi }W_{n}(\nu )I_{n}(\lambda -\nu )d\nu }

mit geeignetem Spektralfenster W n {\displaystyle W_{n}} . In der Regel wird obiges f ^ n ( λ ) {\displaystyle {\hat {f}}_{n}(\lambda )} diskret erzeugt als Summe, und zwar für die sogenannten Fourierfrequenzen λ j = 2 π n j {\displaystyle \lambda _{j}={\frac {2\pi }{n}}j} , wobei j Z {\displaystyle j\in \mathbb {Z} } so gewählt ist, dass π < λ j < π {\displaystyle -\pi <\lambda _{j}<\pi } gilt. Dann hat man die Struktur

f ^ n ( λ j ) = | k n | m ( n ) a k n I n ( λ j + k n ) {\displaystyle {\hat {f}}_{n}(\lambda _{j})=\sum _{|k_{n}|\leq m(n)}a_{k_{n}}I_{n}(\lambda _{j+k_{n}})} .

Wenn die a k n {\displaystyle a_{k_{n}}} und m ( n ) {\displaystyle m(n)} folgende Eigenschaften haben, erzwingt man Konsistenz:[4]

a k n 0 ;   a k n = a k n ;   | k n | m ( n ) a k n = 1 ;   lim n | k n | m ( n ) a k n 2 = 0 ;   lim n m ( n ) = ;   lim n m ( n ) n = 0 {\displaystyle a_{k_{n}}\geq 0;\ a_{k_{n}}=a_{-k_{n}};\ \sum _{|k_{n}|\leq m(n)}a_{k_{n}}=1;\ \lim _{n\to \infty }\sum _{|k_{n}|\leq m(n)}a_{k_{n}}^{2}=0;\ \lim _{n\to \infty }m(n)=\infty ;\ \lim _{n\to \infty }{\frac {m(n)}{n}}=0} .

Die Gewichte a k n {\displaystyle a_{k_{n}}} werden in der Regel durch symmetrische Kernfunktionen K : [ 1 , 1 ] [ 0 , ) {\displaystyle K\colon [-1,1]\to [0,\infty )} mit 1 1 K 2 ( x ) d x < {\displaystyle \int _{-1}^{1}K^{2}(x)dx<\infty } erzeugt gemäß:[5]

a k n = K ( k n m ( n ) ) i = m ( n ) m ( n ) K ( i m ( n ) ) ;     m ( n ) k n m ( n ) {\displaystyle a_{k_{n}}={\frac {K({\frac {k_{n}}{m(n)}})}{\sum _{i=-m(n)}^{m(n)}K({\frac {i}{m(n)}})}};\ \ -m(n)\leq k_{n}\leq m(n)} .

Beispiele

siehe z. B.[5] Vereinfacht schreiben wir jetzt k {\displaystyle k} und m {\displaystyle m} anstatt k n {\displaystyle k_{n}} und m ( n ) {\displaystyle m(n)} .

  • Abgeschnittenes Periodogramm, erzeugt durch den Rechteckkern K ( x ) = χ [ 1 , 1 ] ( x ) {\displaystyle K(x)=\chi _{[-1,1]}(x)} . Dabei ist χ [ 1 , 1 ] {\displaystyle \chi _{[-1,1]}} die Indikatorfunktion. Es ist also a k = 1 {\displaystyle a_{k}=1} für k m {\displaystyle k\leq m} und a k = 0 {\displaystyle a_{k}=0} sonst.
  • Bartlett-Schätzung, erzeugt durch den Dreieck-Kern K ( x ) = max ( 1 | x | , 0 ) {\displaystyle K(x)=\max(1-|x|,0)} , es ist a k = m | k | m 2 {\displaystyle a_{k}={\frac {m-|k|}{m^{2}}}} für k m {\displaystyle k\leq m} und a k = 0 {\displaystyle a_{k}=0} sonst.
  • Parzenschätzung, erzeugt durch einen komplizierteren Kern, der eine günstige asymptotische Varianz liefert:
K ( x ) = { 1 6 | x | 2 + 6 | x | 3 wenn   | x | < 1 2 2 ( 1 | x | ) 3 wenn   1 2 | x | 1 0 sonst {\displaystyle K(x)={\begin{cases}1-6|x|^{2}+6|x|^{3}&{\text{wenn}}\ |x|<{\frac {1}{2}}\\2(1-|x|)^{3}&{\text{wenn}}\ {\frac {1}{2}}\leq |x|\leq 1\\0&{\text{sonst}}\end{cases}}} .

Einzelnachweise

  1. A. Schuster: On the investigation of hidden periodicities with application to a supposed 26 day period of meteorological phenomena. In: Terrestrial Magnetism and Atmospheric Electricity. 3, 1898, S. 13–41, doi:10.1029/TM003i001p00013.
  2. J. Anděl: Statistische Analyse von Zeitreihen. Akademie-Verlag, Berlin 1984.
  3. U. Grenander, M. Rosenblatt: Statistical Analysis of Stationary Time Series. Wiley 1957. (Reprint: American Mathematical Society, 2008) full text
  4. E. Parzen: Mathematical Considerations in the Estimation of Spectra. In: Technometrics. Vol. 3, 1961, S. 167–190, doi:10.1080/00401706.1961.10489939, JSTOR:1266111.
  5. a b P. J. Brockwell and R. A. Davis: Time Series: Theory and Methods. Springer 1987 (jüngste Auflage 2009)