Top 10 articles

Liste der Krankenhäuser in England
Libysche Armee
Odnoklassniki.ru
Libysche Luftwaffe
nasza-klasa.pl
Justin Biber
Der Blitz und die Sonne
Liste von Farben
Liste Moto Guzzi der Motorräder
Liste der politischen Parteien in Flandern

News:

Dichteschätzung

In Wahrscheinlichkeit und Statistiken, Dichteschätzung ist der Aufbau einer Schätzung, basiert auf beobachtet Daten, von einem unbeobachtbaren zugrundeliegenden Wahrscheinlichkeit Dichtefunktion. Die unbeobachtbare Dichtefunktion wird an während die Dichte gedacht, entsprechend der eine große Bevölkerung verteilt wird; die Daten werden normalerweise für eine Zufallsstichprobe von dieser Bevölkerung gehalten.

Eine Vielzahl von Annäherungen an Dichteschätzung wird verwendet und schließt ein Parzen Fenster und eine Strecke Datensammeln Techniken, schließend ein vektorquantelung.

Inhalt

Beispiel der Dichteschätzung

Wir betrachten Aufzeichnungen der Ausdehnung von Diabetes. Das folgende wird wortwörtlich von veranschlagen Modem Beschreibung:

Eine Bevölkerung der Frauen, die mindestens 21 Jahre alt waren, von Pima Indisches Erbe und Leben nahe Phoenix, Arizona, wurden auf Diabetes entsprechend geprüft Weltgesundheitsorganisation Kriterien. Die Daten wurden vom US nationalen Institut von Diabetes und von verdauungsfördernden und Niere-Krankheiten gesammelt. Wir benutzten die 532 kompletten Aufzeichnungen.

In diesem Beispiel konstruieren wir drei Dichteschätzungen für „glu“ (Plasma Glukose Konzentration), eine bedingt auf dem Vorhandensein von Diabetes, dem zweiten Konditional auf dem Fehlen Diabetes und dem Konditional des Third nicht auf Diabetes. Die bedingten Dichteschätzungen sind dann werden verwendet, die Wahrscheinlichkeit aus Diabeteskonditional auf „glu“ zu konstruieren.

Die „glu“ Daten wurden vom MASSENpaket von erhalten R Programmiersprache. Innerhalb 'R, ? Pima.tr und ? Pima.te berichten Sie volleres über den Daten.

Mittel „vom glu“ in den Diabetesfällen ist 143.1 und die Standardabweichung ist 31.26. Das Mittel von „glu“ in den Nichtdiabetes Fällen ist 110.0 und die Standardabweichung ist 24.29. Von diesem sehen wir, daß, in diesem Modem, Diabetesfälle mit grösseren Niveaus von „glu“ verbunden sind. Dieses wird Reiniger durch Plots der geschätzten Dichtefunktionen gebildet.

Die erste Abbildung zeigt Dichteschätzungen von p(glu | diabetes=1), p(glu | diabetes=0) und p(glu). Die Dichteschätzungen sind Kerndichteschätzungen mit einem Gaußschen Kern. Das heißt, wird eine Gaußsche Dichtefunktion an jedem Datenpunkt gesetzt, und die Summe der Dichtefunktionen wird über der Strecke der Daten berechnet.

Geschätzte Dichte von p(glu | diabetes=1) (Rot), p(glu | diabetes=0) (Blau) und p(glu) (Schwarzes).

Von der Dichte „glu“ des Konditionals auf Diabetes, können wir die Wahrscheinlichkeit des Diabeteskonditionals auf „glu“ über erhalten Richtlinie Bayes. Für Kürze „Diabetes“ ist abgekürztes „DB.“ in dieser Formel.

Die zweite Abbildung zeigt die geschätzte hintere Wahrscheinlichkeit p(diabetes=1 | glu). Von diesen Daten scheint es, daß ein erhöhtes Niveau von „glu“ mit Diabetes verbunden ist.

Geschätzte Wahrscheinlichkeit von p(diabetes=1 | glu).

Index zum Beispiel

Die folgenbefehle von R Programmiersprache verursacht die Abbildungen, die oben gezeigt werden. Diese Befehle können am Befehlseingabeformat eingetragen werden, indem man Schnitt und Paste verwendet.

Bibliothek (MASSEN)
 Daten (Pima.tr)

 Daten (Pima.te)

 Pima <- rbind (Pima.tr, Pima.te)
 glu <- Pima [, „glu“]

 } <- Pima [, „Art“] == „nicht“
 d1 <- Pima [, „Art“] == „ja“
 base.rate.d1 <- summieren (d1)/(Summe (d1) + Summe (}))

glu.density <- Dichte (glu)
 glu.d0.density <- Dichte (glu [}])
 glu.d1.density <- Dichte (glu [d1])

 approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
 approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- Funktion (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- p.d.given.glu (x, base.rate.d1)
 Plot (x, y, type='l', col='red', xlab='glu', ylab='estimated p (Diabetes|glu) ')

 Plot (Dichte (glu [}]), col='blue', xlab='glu', ylab='estimate p (glu),
 p (glu|Diabetes), p (glu|nicht Diabetes) ', main=NA)
 Linien (Dichte (glu [d1]), col='red')
 Linien (Dichte (glu))

Sehen Sie auch

Hinweise

  • Brian D. Ripley. Mustererkennung und neurale Netze. Cambridge: Cambridge Universitätspresse, 1996.
  • Trevor Hastie, Robert Tibshirani und Jerome Friedman. Die Elemente des statistischen Lernens. New York: Springer, 2001. ISBN 0-387-95284-5. (Sehen Sie Kapitel 6.)
  • D.W. Scott. Multivariate Dichte-Schätzung. Theorie, Praxis und Sichtbarmachung. New York: Wiley, 1992.
  • B.W. Silverman. Dichte-Schätzung. London: Chapman und Hall, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler und R.S. Johannes. „, den ADAP erlernenalgorithmus verwendend, um den Angriff von Diabetes mellitus zu prognostizieren“. In Verfahren der Zusammenstellung auf Computeranwendungen in der medizinischen Behandlung (Washington, 1988), E-D. R.A. Greenes, pp. 261-265. Los Alamitos, Ca: IEEE Computer-Gesellschaft-Presse, 1988.

Externe Verbindungen

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence