News: |
In Wahrscheinlichkeit und Statistiken, Dichteschätzung ist der Aufbau einer Schätzung, basiert auf beobachtet Daten, von einem unbeobachtbaren zugrundeliegenden Wahrscheinlichkeit Dichtefunktion. Die unbeobachtbare Dichtefunktion wird an während die Dichte gedacht, entsprechend der eine große Bevölkerung verteilt wird; die Daten werden normalerweise für eine Zufallsstichprobe von dieser Bevölkerung gehalten.
Eine Vielzahl von Annäherungen an Dichteschätzung wird verwendet und schließt ein Parzen Fenster und eine Strecke Datensammeln Techniken, schließend ein vektorquantelung.
Inhalt |
Wir betrachten Aufzeichnungen der Ausdehnung von Diabetes. Das folgende wird wortwörtlich von veranschlagen Modem Beschreibung:
In diesem Beispiel konstruieren wir drei Dichteschätzungen für „glu“ (Plasma Glukose Konzentration), eine bedingt auf dem Vorhandensein von Diabetes, dem zweiten Konditional auf dem Fehlen Diabetes und dem Konditional des Third nicht auf Diabetes. Die bedingten Dichteschätzungen sind dann werden verwendet, die Wahrscheinlichkeit aus Diabeteskonditional auf „glu“ zu konstruieren.
Die „glu“ Daten wurden vom MASSENpaket von erhalten R Programmiersprache. Innerhalb 'R, ? Pima.tr und ? Pima.te berichten Sie volleres über den Daten.
Mittel „vom glu“ in den Diabetesfällen ist 143.1 und die Standardabweichung ist 31.26. Das Mittel von „glu“ in den Nichtdiabetes Fällen ist 110.0 und die Standardabweichung ist 24.29. Von diesem sehen wir, daß, in diesem Modem, Diabetesfälle mit grösseren Niveaus von „glu“ verbunden sind. Dieses wird Reiniger durch Plots der geschätzten Dichtefunktionen gebildet.
Die erste Abbildung zeigt Dichteschätzungen von p(glu | diabetes=1), p(glu | diabetes=0) und p(glu). Die Dichteschätzungen sind Kerndichteschätzungen mit einem Gaußschen Kern. Das heißt, wird eine Gaußsche Dichtefunktion an jedem Datenpunkt gesetzt, und die Summe der Dichtefunktionen wird über der Strecke der Daten berechnet.
Von der Dichte „glu“ des Konditionals auf Diabetes, können wir die Wahrscheinlichkeit des Diabeteskonditionals auf „glu“ über erhalten Richtlinie Bayes. Für Kürze „Diabetes“ ist abgekürztes „DB.“ in dieser Formel.
Die zweite Abbildung zeigt die geschätzte hintere Wahrscheinlichkeit p(diabetes=1 | glu). Von diesen Daten scheint es, daß ein erhöhtes Niveau von „glu“ mit Diabetes verbunden ist.
Die folgenbefehle von R Programmiersprache verursacht die Abbildungen, die oben gezeigt werden. Diese Befehle können am Befehlseingabeformat eingetragen werden, indem man Schnitt und Paste verwendet.
Bibliothek (MASSEN)
Daten (Pima.tr)
Daten (Pima.te)
Pima <- rbind (Pima.tr, Pima.te)
glu <- Pima [, „glu“]
} <- Pima [, „Art“] == „nicht“
d1 <- Pima [, „Art“] == „ja“
base.rate.d1 <- summieren (d1)/(Summe (d1) + Summe (}))
glu.density <- Dichte (glu)
glu.d0.density <- Dichte (glu [}])
glu.d1.density <- Dichte (glu [d1])
approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f
p.d.given.glu <- Funktion (glu, base.rate.d1)
{
p1 <- glu.d1.f (glu) * base.rate.d1
p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
p1/(p0+p1)
}
x <- 1:250
y <- p.d.given.glu (x, base.rate.d1)
Plot (x, y, type='l', col='red', xlab='glu', ylab='estimated p (Diabetes|glu) ')
Plot (Dichte (glu [}]), col='blue', xlab='glu', ylab='estimate p (glu),
p (glu|Diabetes), p (glu|nicht Diabetes) ', main=NA)
Linien (Dichte (glu [d1]), col='red')
Linien (Dichte (glu))
|
Custom Search
|
© Copyright 2011 WorldLingo. Alle Rechte vorbehalten.