A-posteriori-Wahrscheinlichkeit

Die A-posteriori-Wahrscheinlichkeit ist ein Begriff aus der bayesschen Statistik. Sie beschreibt den Wissensstand über einen unbekannten Umweltzustand θ {\displaystyle \theta } a posteriori, d. h. nach der Beobachtung einer Zufallsgröße X {\displaystyle X} , die von θ {\displaystyle \theta } in statistischer Abhängigkeit steht.

Definition

Folgende Situation ist gegeben: θ {\displaystyle \theta } ist ein unbekannter Umweltzustand (z. B. ein Parameter einer Wahrscheinlichkeitsverteilung), der auf der Basis von Beobachtungen x {\displaystyle x} einer Zufallsgröße X {\displaystyle X} geschätzt werden soll.

Gegeben sei eine Verteilung für den Parameter θ {\displaystyle \theta } vor der Beobachtung der Stichprobe. Diese Verteilung wird auch A-priori-Verteilung genannt.

Weiterhin sei die Dichte (bzw. im diskreten Fall: die Wahrscheinlichkeitsfunktion) der bedingten Verteilung der Stichprobe unter der Bedingung θ = θ 0 {\displaystyle \theta =\theta _{0}} gegeben. Diese Dichte (bzw. Wahrscheinlichkeitsfunktion) wird im Folgenden mit f ( x | θ 0 ) {\displaystyle f(x|\theta _{0})} bezeichnet.

Die A-posteriori-Verteilung ist die Verteilung des Populationsparameters θ {\displaystyle \theta } unter der Bedingung, dass für die Zufallsgröße X {\displaystyle X} der Wert x {\displaystyle x} beobachtet wurde. Die A-posteriori-Verteilung wird mit Hilfe des Satzes von Bayes aus der A-priori-Verteilung und der bedingten Verteilung der Stichprobe unter der Bedingung θ = θ 0 {\displaystyle \theta =\theta _{0}} berechnet.

A-posteriori-Verteilung

Für stetige A-priori-Verteilungen

Eine stetige A-priori-Verteilung liegt dann vor, wenn die A-priori-Verteilung auf der Menge der reellen Zahlen R {\displaystyle \mathbb {R} } oder auf einem Intervall in R {\displaystyle \mathbb {R} } definiert ist. Beispiele für stetige A-priori-Verteilungen sind:

  • die Normalverteilung (hier ist der Parameterraum Θ {\displaystyle \Theta } die Menge der reellen Zahlen) oder
  • die Gleichverteilung auf dem Intervall [ 0 ; 1 ] {\displaystyle [0;1]} (hier ist der Parameterraum Θ {\displaystyle \Theta } das Intervall [ 0 ; 1 ] {\displaystyle [0;1]} ).

Im Folgenden steht g ( θ ) {\displaystyle g(\theta )} für die auf dem Parameterraum Θ {\displaystyle \Theta } definierte A-priori-Dichte von θ . {\displaystyle \theta .}

In diesem Fall kann die A-posteriori-Dichte h ( θ | x ) {\displaystyle h(\theta |x)} folgendermaßen berechnet werden:[1]

h ( θ 0 x ) = f ( x θ 0 ) g ( θ 0 ) Θ f ( x θ ) g ( θ ) d θ {\displaystyle h(\theta _{0}\mid x)={\frac {f(x\mid \theta _{0})\,g(\theta _{0})}{\displaystyle \int _{\Theta }f(x\mid \theta ')\,g(\theta ')\,\mathrm {d} \theta '}}\!}

Für diskrete A-priori-Verteilungen

Im folgenden Abschnitt steht P ( θ = θ 0 ) {\displaystyle P(\theta =\theta _{0})} für die diskrete A-priori-Wahrscheinlichkeit, dass der Parameter θ {\displaystyle \theta } den Wert θ 0 {\displaystyle \theta _{0}} annimmt. Eine diskrete A-priori-Verteilung ist auf einer endlichen Menge oder auf einer Menge mit abzählbar unendlichem Träger definiert.

Die A-posteriori-Wahrscheinlichkeit wird im Folgenden mit P ( θ = θ 0 | x ) {\displaystyle P(\theta =\theta _{0}|x)} bezeichnet und kann auf folgende Weise berechnet werden:[1]

P ( θ = θ 0 | x ) = f ( x | θ 0 ) P ( θ = θ 0 ) θ Θ f ( x | θ ) P ( θ = θ ) {\displaystyle P(\theta =\theta _{0}|x)={\frac {f(x|\theta _{0})\,P(\theta =\theta _{0})}{\displaystyle \sum _{\theta '\in \Theta }f(x|\theta ')\,P(\theta =\theta ')}}\!}

Bedeutung in der bayesschen Statistik

In der bayesschen Statistik stellt die A-posteriori-Verteilung den neuen, durch Vorwissen und Beobachtung bestimmten Kenntnisstand über die Verteilung des Parameters θ {\displaystyle \theta } nach der Beobachtung der Stichprobe dar.

Damit ist die A-posteriori-Verteilung die Grundlage zur Berechnung aller Punktschätzer (siehe Bayes-Schätzer) und Glaubwürdigkeitsintervalle.[1]

Beispiel

In einer Urne befinden sich rote und schwarze Kugeln. Es ist bekannt, dass der Anteil roter Kugeln entweder bei 40 % oder aber bei 60 % liegt. Um Genaueres herauszufinden, werden (mit Zurücklegen) 11 Kugeln aus der Urne gezogen. Es werden 4 rote und 7 schwarze Kugeln gezogen.

Die Zufallsgröße „Anzahl gezogener roter Kugeln“ wird im Folgenden mit X {\displaystyle X} bezeichnet, der tatsächlich beobachtete Wert der Zufallsgröße mit x {\displaystyle x} .

Die Zufallsgröße X {\displaystyle X} ist binomialverteilt mit unbekanntem Parameter θ , {\displaystyle \theta ,} wobei θ {\displaystyle \theta } nur einen der Werte 0 , 4 {\displaystyle 0{,}4} oder 0 , 6 {\displaystyle 0{,}6} annehmen kann. Da kein weiteres Vorwissen bekannt ist, wird als A-priori-Verteilung für θ {\displaystyle \theta } eine diskrete Gleichverteilung angenommen, d. h.

P ( θ = 0 , 4 ) = P ( θ = 0 , 6 ) = 0 , 5. {\displaystyle P(\theta =0{,}4)=P(\theta =0{,}6)=0{,}5.}

Die Wahrscheinlichkeitsfunktion für X = x {\displaystyle X=x} ergibt sich aus der Binomialverteilung zu

f ( X = 4 θ = θ 0 ) = ( 11 4 ) θ 0 4 ( 1 θ 0 ) 7 . {\displaystyle f(X=4\mid \theta =\theta _{0})={11 \choose 4}\;{\theta _{0}}^{4}\;(1-\theta _{0})^{7}.}

Man erhält daher für θ 0 = 0 , 4 {\displaystyle \theta _{0}=0{,}4}

f ( X = 4 θ = 0 , 4 ) = ( 11 4 ) 0 , 4 4 0 , 6 7 = 0,236. {\displaystyle f(X=4\mid \theta =0{,}4)={11 \choose 4}\;0{,}4^{4}\;0{,}6^{7}=0{,}236.}

Für θ 0 = 0 , 6 {\displaystyle \theta _{0}=0{,}6} erhält man

f ( X = 4 θ = 0 , 6 ) = ( 11 4 ) 0 , 6 4 0 , 4 7 = 0 , 07. {\displaystyle f(X=4\mid \theta =0{,}6)={11 \choose 4}\;0{,}6^{4}\;0{,}4^{7}=0{,}07.}

Die A-posteriori-Verteilung kann nun mit Hilfe des Satzes von Bayes berechnet werden. Für θ = 0 , 4 {\displaystyle \theta =0{,}4} erhält man als A-posteriori-Wahrscheinlichkeit

P ( θ = 0 , 4 x = 4 ) = 0,236 0 , 5 0,236 0 , 5 + 0 , 07 0 , 5 = 0 , 77. {\displaystyle P(\theta =0{,}4\mid x=4)={\frac {0{,}236\cdot 0{,}5}{0{,}236\cdot 0{,}5+0{,}07\cdot 0{,}5}}=0{,}77.}

Für θ = 0 , 6 {\displaystyle \theta =0{,}6} ergibt sich die A-posteriori-Wahrscheinlichkeit

P ( θ = 0 , 6 x = 4 ) = 0 , 07 0 , 5 0,236 0 , 5 + 0 , 07 0 , 5 = 0 , 23. {\displaystyle P(\theta =0{,}6\mid x=4)={\frac {0{,}07\cdot 0{,}5}{0{,}236\cdot 0{,}5+0{,}07\cdot 0{,}5}}=0{,}23.}

Somit ist nach Ziehung der Stichprobe die Wahrscheinlichkeit, dass der Anteil roter Kugeln in der Urne 40 % beträgt, gleich 0 , 77 {\displaystyle 0{,}77} .

Siehe auch

Einzelnachweise

  1. a b c Bernhard Rüger (1988), S. 152 ff.

Literatur

  • Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
  • Hans-Otto Georgii: Stochastik – Einführung in die Wahrscheinlichkeitstheorie und Statistik. de Gruyter Verlag, Berlin New York 2007. ISBN 978-3-11-019349-7