Substitutionsprinzip (Statistik)

Das Substitutionsprinzip ist eine Methode der Schätztheorie, eines Teilgebiets der mathematischen Statistik, zur Gewinnung von Schätzfunktionen. Wichtiger Spezialfall des Substitutionsprinzips ist die Momentenmethode. Ein durch das Substitutionsprinzip gewonnener Schätzer wird im Englischen als plug-in estimator oder substitution estimator bezeichnet.

Formulierung

Gegeben sei eine Menge P {\displaystyle {\mathcal {P}}} von Wahrscheinlichkeitsverteilungen auf den reellen Zahlen. Seien die Zufallsvariablen X 1 , X 2 , , X N {\displaystyle X_{1},X_{2},\dots ,X_{N}} unabhängig identisch verteilt gemäß einem P 0 P {\displaystyle P_{0}\in {\mathcal {P}}} und sei X = ( X 1 , X 2 , , X N ) {\displaystyle X=(X_{1},X_{2},\dots ,X_{N})} .

Geschätzt werden soll ein Funktional

q : P R {\displaystyle q\colon {\mathcal {P}}\to \mathbb {R} }

von der Form

q ( P ) = R f ( x ) d P {\displaystyle q(P)=\int _{\mathbb {R} }f(x)\mathrm {d} P} .

Dann ist

q ^ ( X ) = 1 N i = 1 N f ( X i ) {\displaystyle {\hat {q}}(X)={\frac {1}{N}}\sum _{i=1}^{N}f(X_{i})}

eine mögliche Schätzfunktion für q {\displaystyle q}

Beispiel: Momentenmethode

Ein Beispiel des Substitutionsprinzips ist die Momentenmethode. Soll das n {\displaystyle n} -te Moment geschätzt werden, so ist das zu schätzende Funktional von der Form

q ( P ) = R x n d P {\displaystyle q(P)=\int _{\mathbb {R} }x^{n}\mathrm {d} P} ,

es ist also f ( x ) = x n {\displaystyle f(x)=x^{n}} . Das Substitutionsprinzip liefert somit den Schätzer

q ^ ( X ) = 1 N i = 1 N X i n {\displaystyle {\hat {q}}(X)={\frac {1}{N}}\sum _{i=1}^{N}X_{i}^{n}} .

Dasselbe Vorgehen für eine zu schätzende Funktion f = f ( x , x 2 , , x n ) {\displaystyle f=f(x,x^{2},\dots ,x^{n})} liefert somit die Momentenmethode.

Allgemeine Fassung

Die obige Version lässt sich noch allgemeiner fassen, wodurch auch die Namensgebung klarer wird. Gegeben sei wieder eine Menge von Wahrscheinlichkeitsverteilungen P {\displaystyle {\mathcal {P}}} sowie X 1 , X 2 , , X N {\displaystyle X_{1},X_{2},\dots ,X_{N}} unabhängig identisch verteilte Zufallsvariablen gemäß einem P 0 P {\displaystyle P_{0}\in {\mathcal {P}}} und sei X = ( X 1 , X 2 , , X N ) {\displaystyle X=(X_{1},X_{2},\dots ,X_{N})} . Zu schätzen ist ein Funktional

q : P R {\displaystyle q\colon {\mathcal {P}}\to \mathbb {R} } .

Anstatt das Funktional nun direkt zu schätzen, wird zuerst ein Schätzer

P ^ N = p N ( X 1 , X 2 , , X N ) {\displaystyle {\hat {P}}_{N}=p_{N}(X_{1},X_{2},\dots ,X_{N})}

für P {\displaystyle P} herangezogen. Hierbei ist p N {\displaystyle p_{N}} eine passend gewählte messbare Funktion. Nun wird das Wahrscheinlichkeitsmaß P {\displaystyle P} durch die entsprechende Schätzung mittels P ^ N {\displaystyle {\hat {P}}_{N}} substituiert und die so gewonnene Funktion q ( P ^ N ) {\displaystyle q({\hat {P}}_{N})} als Schätzfunktion verwendet. Im obigen Spezialfall wird beispielsweise die Wahrscheinlichkeitsverteilung auf den reellen Zahlen durch die empirische Verteilung substituiert.

Quellen

  • Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 72–77, doi:10.1007/978-3-642-17261-8. 
  • Hein Putter, Willem R. van Zweet: Resampling: consistency of substitution estimators. In: Project euklid. 2002, abgerufen am 28. Februar 2017.