Top 10 άρθρα

Odnoklassniki.ru
Δαίμονας
Ρωσική πρωτοπορία
Ιστορία της εναλλακτικής ιατρικής
Εταιρική διακυβέρνηση
Ryanair
Non-Hodgkin λέμφωμα
Κατάλογος τεχνικών kyokushin
Κατάλογος λατινικών φράσεων (SZ)
Κατάλογος ασθενειών σκυλιών

News:

Εκτίμηση πυκνότητας

πιθανότητα και στατιστικές, εκτίμηση πυκνότητας είναι η κατασκευή μιας εκτίμησης, βασισμένη παρατηρηθείς στοιχεία, unobservable να κρυφτεί κάτω από λειτουργία πυκνότητας πιθανότητας. Η unobservable λειτουργία πυκνότητας θεωρείται ως πυκνότητα σύμφωνα με την οποία ένας μεγάλος πληθυσμός διανέμεται τα στοιχεία θεωρούνται συνήθως ως τυχαίο δείγμα από εκείνο τον πληθυσμό.

Ποικίλες προσεγγίσεις στην εκτίμηση πυκνότητας χρησιμοποιούνται, συμπερίληψη Παράθυρα Parzen και μια σειρά συγκέντρωση στοιχείων τεχνικές, συμπερίληψη διανυσματική κβαντοποίηση.

Περιεχόμενο

Παράδειγμα της εκτίμησης πυκνότητας

Εξετάζουμε τα αρχεία της επίπτωσης διαβήτης. Ο ακόλουθος αναφέρεται κατά λέξη σύνολο στοιχείων περιγραφή:

Ένας πληθυσμός των γυναικών που ήταν τουλάχιστον 21 ετών, Pima Η ινδική κληρονομιά και η διαβίωση κοντά στο Φοίνικας, Αριζόνα, εξετάστηκαν για το διαβήτη σύμφωνα με Παγκόσμια Οργάνωση Υγείας κριτήρια. Τα στοιχεία συλλέχθηκαν από το αμερικανικό εθνικό ίδρυμα διαβήτη και χωνευτικών και ασθενειών νεφρών. Χρησιμοποιήσαμε τα 532 πλήρη πρακτικά.

Σε αυτό το παράδειγμα, κατασκευάζουμε τρεις εκτιμήσεις πυκνοτήτων για «το glu» (πλάσμα γλυκόζη συγκέντρωση), ένας υπό όρους στην παρουσία διαβήτη, δεύτερο τον υπό όρους στην απουσία διαβήτη, και το τρίτο μη υπό όρους στο διαβήτη. Οι υπό όρους εκτιμήσεις πυκνότητας είναι έπειτα χρησιμοποιούνται για να κατασκευάσουν την πιθανότητα του διαβήτη υπό όρους «στο glu».

Τα στοιχεία «glu» λήφθηκαν από τη ΜΑΖΙΚΗ συσκευασία Γλώσσα προγραμματισμού Ρ. Μέσα «R, ; Pima.tr και ; Pima.te δώστε μια πληρέστερη περιγραφή των στοιχείων.

σημάνετε από «το glu» στο διαβήτη οι περιπτώσεις είναι 143.1 και η σταθερή απόκλιση είναι 31.26. Ο μέσος όρος «glu» στις περιπτώσεις μη-διαβήτη είναι 110.0 και η σταθερή απόκλιση είναι 24.29. Από αυτό βλέπουμε ότι, σε αυτό το σύνολο στοιχείων, οι περιπτώσεις διαβήτη συνδέονται με τα μεγαλύτερα επίπεδα «glu». Αυτό θα καταστεί σαφές από τις πλοκές των κατ' εκτίμηση λειτουργιών πυκνότητας.

Ο πρώτος αριθμός παρουσιάζει εκτιμήσεις πυκνότητας π(glu | diabetes=1), π(glu | diabetes=0), και π(glu). Οι εκτιμήσεις πυκνότητας είναι εκτιμήσεις πυκνότητας πυρήνων που χρησιμοποιούν έναν γκαουσσιανό πυρήνα. Δηλαδή μια γκαουσσιανή λειτουργία πυκνότητας τοποθετείται σε κάθε σημείο στοιχείων, και το ποσό των λειτουργιών πυκνότητας υπολογίζεται πέρα από τη σειρά των στοιχείων.

Κατ' εκτίμηση πυκνότητα π(glu | diabetes=1) (κόκκινο), π(glu | diabetes=0) (μπλε), και π(glu) (ο Μαύρος).

Από την πυκνότητα «του glu» υπό όρους στο διαβήτη, μπορούμε να λάβουμε την πιθανότητα του διαβήτη υπό όρους «στο glu» μέσω Κανόνας Bayes. Για τη συντομία, «ο διαβήτης» βραχύνεται «DB.» σε αυτόν τον τύπο.

Ο δεύτερος αριθμός παρουσιάζει κατ' εκτίμηση μεταγενέστερη πιθανότητα π(diabetes=1 | glu). Από αυτά τα στοιχεία, φαίνεται ότι ένα αυξανόμενο επίπεδο «glu» συνδέεται με το διαβήτη.

Κατ' εκτίμηση πιθανότητα π(diabetes=1 | glu).

Χειρόγραφο παραδείγματος χάριν

Ακολουθήστε τις εντολές Γλώσσα προγραμματισμού Ρ θα δημιουργήσει τους αριθμούς που παρουσιάζονται ανωτέρω. Αυτές οι εντολές μπορούν να εισαχθούν στην υπαγόρευση εντολής με τη χρησιμοποίηση του cut-$l*and-$l*paste.

στοιχεία στοιχείων βιβλιοθηκών (
ΜΑΖΑ) (Pima.tr

) (Pima.te)

 Pima <- rbind (Pima.tr, Pima.te)
 glu <- Pima [, «glu»]

 d0 <- Pima [, «τύπος»] == «κανένα»
 d1 <- Pima [, «τύπος»] == «ναι»
 base.rate.d1 <- αθροίστε (d1)/(ποσό (d1) + ποσό (d0))

glu.density <- πυκνότητα (glu)
 glu.d0.density <- πυκνότητα (glu [d0])
 glu.d1.density <- πυκνότητα (glu [d1])

 approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
 approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- λειτουργία (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

Χ <- 1:250
 Υ <- (Χ, base.rate.d1) πλοκή
 p.d.given.glu (το Χ, Υ, type='l', col='red', xlab='glu', το π (διαβήτης|glu) «)

 πλοκή (πυκνότητα (glu [d0]), col='blue', xlab='glu', ylab='estimate π (glu),
 π (glu|διαβήτης), π (glu|όχι διαβήτης) «, main=NA)
 γραμμές (πυκνότητα (glu [d1]), col='red')
 γραμμές (πυκνότητα (glu))

Δείτε επίσης

Αναφορές

  • Brian D. Ripley. Αναγνώριση σχεδίων και νευρικά δίκτυα. Καίμπριτζ: Πανεπιστημιακός Τύπος του Καίμπριτζ, 1996.
  • Trevor Hastie, Robert Tibshirani, και Jerome Friedman. Τα στοιχεία της στατιστικής εκμάθησης. Νέα Υόρκη: Άλτης, 2001. ISBN 0-387-95284-5. (Δείτε το κεφάλαιο 6.)
  • D.W. Scott. Πολλών μεταβλητών εκτίμηση πυκνότητας. Θεωρία, πρακτική και απεικόνιση. Νέα Υόρκη: Ουίλι, 1992.
  • B.W. Silverman. Εκτίμηση πυκνότητας. Λονδίνο: Γυρολόγος και αίθουσα, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler, και R.S. Johannes. «Χρησιμοποιώντας τον αλγόριθμο εκμάθησης ADAP για να προβλέψει την αρχή του διαβήτη mellitus». Πρακτικά του συμποσίου για τις εφαρμογές υπολογιστών στην ιατρική φροντίδα (Ουάσιγκτον, 1988), ed. R.A. Greenes, Σ. 261-265. Los Alamitos, ασβέστιο: IEEE Τύπος κοινωνίας υπολογιστών, 1988.

Εξωτερικές συνδέσεις

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence