Top 10 Articles

Zoophilia
Liste de prières et de bénédictions juives
Pastèque
Gmail
Saola
Odnoklassniki.ru
Xeroderma pigmentosum
La maladie de Minamata
Orkut
Liste de missions de maintien de la paix des Nations Unies

News:

Évaluation de densité

Dans probabilité et statistiques, évaluation de densité est la construction d'une évaluation, basée sur observé données, d'un fondamental inobservable fonction de densité de probabilité. La fonction inobservable de densité est considérée pendant que la densité selon laquelle une grande population est distribuée ; les données sont habituellement considérées comme un échantillon aléatoire de cette population.

Une variété d'approches à l'évaluation de densité sont employées, incluant Fenêtres de Parzen et une gamme de grouper de données techniques, incluant quantification de vecteur.

Table des matières

Exemple d'évaluation de densité

Nous considérons des disques de l'incidence de diabète. Ce qui suit est cité in extenso du Modem description :

Une population des femmes qui étaient au moins 21 années, de Pima L'héritage et la vie indiens près de Phoenix, Arizona, ont été examinés pour le diabète selon L'organisation mondiale de la santé critères. Les données ont été rassemblées par l'institut national des USA du diabète et des maladies digestives et de rein. Nous avons employé les 532 disques complets.

Dans cet exemple, nous construisons trois évaluations de densité pour le « glu » (plasma glucose concentration), une conditionnel sur la présence du diabète, le deuxième conditionnel sur l'absence du diabète, et le conditionnel de tiers pas sur le diabète. Les évaluations conditionnelles de densité sont alors soient employées pour construire la probabilité avec du conditionnel de diabète sur le « glu ».

Les données de « glu » ont été obtenues à partir du paquet DE MASSE du Langage de programmation de R. Dans 'R, ? Pima.tr et ? Pima.te faites un plus plein exposé des données.

moyen de « glu » dans les cas de diabète est 143.1 et l'écart type est 31.26. Le moyen du « glu » dans les cas de non-diabète est 110.0 et l'écart type est 24.29. De ceci nous voyons que, dans ce Modem, des cas de diabète sont associés à de plus grands niveaux de « glu ». Ceci sera fait à clairifiant par des parcelles de terrain des fonctions estimées de densité.

La première figure montre des évaluations de densité de p(glu | diabetes=1), p(glu | diabetes=0), et p(glu). Les évaluations de densité sont des évaluations de densité de grain en utilisant un grain gaussien. C'est-à-dire, une fonction gaussienne de densité est placée à chaque point de repères, et la somme des fonctions de densité est calculée sur la gamme des données.

Densité estimée de p(glu | diabetes=1) (rouge), p(glu | diabetes=0) (bleu), et p(glu) (noir).

À partir de la densité du conditionnel de « glu » sur le diabète, nous pouvons obtenir la probabilité du conditionnel de diabète sur le « glu » par l'intermédiaire de La règle de Bayes. Pour la brièveté, le « diabète » est « DB abrégé. » dans cette formule.

La deuxième figure montre la probabilité postérieure estimée p(diabetes=1 | glu). De ces données, il s'avère qu'un plus grand niveau de « glu » est associé au diabète.

Probabilité estimée de p(diabetes=1 | glu).

Manuscrit par exemple

Les commandes de suivre du Langage de programmation de R créera les figures montrées ci-dessus. Ces commandes peuvent être écrites au message de sollicitation de commande en employant le découpage et le déplacement.

bibliothèque (DE MASSE)
 donnée (Pima.tr)

 donnée (Pima.te)

 Pima <- glu du rbind (Pima.tr, Pima.te
) <- Pima [, « glu »]

 } <- == « pas » d1 de Pima [, « type »
] <- Pima [, « type »] == « oui »
 base.rate.d1 <- additionnent (d1)/(somme (d1) + somme (}))

glu.density <- densité (glu)
 glu.d0.density <- densité (glu [}])
 glu.d1.density <- approxfun de densité (glu [d1]

) (glu.d0.density$x, glu.d0.density$y) -> approxfun
 de glu.d0.f (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- fonction (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

X <- 1:250
 y <- parcelle de terrain de p.d.given.glu (x, base.rate.d1
) (x, y, type='l', col='red', xlab='glu', ylab='estimated p (diabète|parcelle de terrain de glu) '

) (densité (glu [}]), ylab='estimate p (glu), p (
glu de col='blue', xlab='glu',|diabète), p (glu|pas diabète) ', lignes de main=NA
) (densité (glu [d1]), lignes
 de col='red') (densité (glu))

Voyez également

Références

  • Brian D. Ripley. Identification de modèle et réseaux neurologiques. Cambridge : Pression d'université de Cambridge, 1996.
  • Trevor Hastie, Robert Tibshirani, et Jerome Friedman. Les éléments de l'étude statistique. New York : Springer, 2001. ISBN 0-387-95284-5. (Voir le chapitre 6.)
  • D.W. Scott. Évaluation multivariable de densité. Théorie, pratique et visualisation. New York : Wiley, 1992.
  • B.W. Silverman. Évaluation de densité. Londres : Chapman et Hall, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler, et R.S. Johannes. « En utilisant l'algorithme de étude d'ADAP pour prévoir le début du mellitus de diabète ». Dans Démarches du colloque sur des applications informatiques dans le soin médical (Washington, 1988), E-D. R.A. Greenes, pp. 261-265. Los Alamitos, CA : Pression de société d'ordinateur d'IEEE, 1988.

Liens externes

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence