News: |
πιθανότητα και στατιστικές, εκτίμηση πυκνότητας είναι η κατασκευή μιας εκτίμησης, βασισμένη παρατηρηθείς στοιχεία, unobservable να κρυφτεί κάτω από λειτουργία πυκνότητας πιθανότητας. Η unobservable λειτουργία πυκνότητας θεωρείται ως πυκνότητα σύμφωνα με την οποία ένας μεγάλος πληθυσμός διανέμεται τα στοιχεία θεωρούνται συνήθως ως τυχαίο δείγμα από εκείνο τον πληθυσμό.
Ποικίλες προσεγγίσεις στην εκτίμηση πυκνότητας χρησιμοποιούνται, συμπερίληψη Παράθυρα Parzen και μια σειρά συγκέντρωση στοιχείων τεχνικές, συμπερίληψη διανυσματική κβαντοποίηση.
Περιεχόμενο |
Εξετάζουμε τα αρχεία της επίπτωσης διαβήτης. Ο ακόλουθος αναφέρεται κατά λέξη σύνολο στοιχείων περιγραφή:
Σε αυτό το παράδειγμα, κατασκευάζουμε τρεις εκτιμήσεις πυκνοτήτων για «το glu» (πλάσμα γλυκόζη συγκέντρωση), ένας υπό όρους στην παρουσία διαβήτη, δεύτερο τον υπό όρους στην απουσία διαβήτη, και το τρίτο μη υπό όρους στο διαβήτη. Οι υπό όρους εκτιμήσεις πυκνότητας είναι έπειτα χρησιμοποιούνται για να κατασκευάσουν την πιθανότητα του διαβήτη υπό όρους «στο glu».
Τα στοιχεία «glu» λήφθηκαν από τη ΜΑΖΙΚΗ συσκευασία Γλώσσα προγραμματισμού Ρ. Μέσα «R, ; Pima.tr και ; Pima.te δώστε μια πληρέστερη περιγραφή των στοιχείων.
σημάνετε από «το glu» στο διαβήτη οι περιπτώσεις είναι 143.1 και η σταθερή απόκλιση είναι 31.26. Ο μέσος όρος «glu» στις περιπτώσεις μη-διαβήτη είναι 110.0 και η σταθερή απόκλιση είναι 24.29. Από αυτό βλέπουμε ότι, σε αυτό το σύνολο στοιχείων, οι περιπτώσεις διαβήτη συνδέονται με τα μεγαλύτερα επίπεδα «glu». Αυτό θα καταστεί σαφές από τις πλοκές των κατ' εκτίμηση λειτουργιών πυκνότητας.
Ο πρώτος αριθμός παρουσιάζει εκτιμήσεις πυκνότητας π(glu | diabetes=1), π(glu | diabetes=0), και π(glu). Οι εκτιμήσεις πυκνότητας είναι εκτιμήσεις πυκνότητας πυρήνων που χρησιμοποιούν έναν γκαουσσιανό πυρήνα. Δηλαδή μια γκαουσσιανή λειτουργία πυκνότητας τοποθετείται σε κάθε σημείο στοιχείων, και το ποσό των λειτουργιών πυκνότητας υπολογίζεται πέρα από τη σειρά των στοιχείων.
Από την πυκνότητα «του glu» υπό όρους στο διαβήτη, μπορούμε να λάβουμε την πιθανότητα του διαβήτη υπό όρους «στο glu» μέσω Κανόνας Bayes. Για τη συντομία, «ο διαβήτης» βραχύνεται «DB.» σε αυτόν τον τύπο.
Ο δεύτερος αριθμός παρουσιάζει κατ' εκτίμηση μεταγενέστερη πιθανότητα π(diabetes=1 | glu). Από αυτά τα στοιχεία, φαίνεται ότι ένα αυξανόμενο επίπεδο «glu» συνδέεται με το διαβήτη.
Ακολουθήστε τις εντολές Γλώσσα προγραμματισμού Ρ θα δημιουργήσει τους αριθμούς που παρουσιάζονται ανωτέρω. Αυτές οι εντολές μπορούν να εισαχθούν στην υπαγόρευση εντολής με τη χρησιμοποίηση του cut-$l*and-$l*paste.
στοιχεία στοιχείων βιβλιοθηκών (
ΜΑΖΑ) (Pima.tr
) (Pima.te)
Pima <- rbind (Pima.tr, Pima.te)
glu <- Pima [, «glu»]
d0 <- Pima [, «τύπος»] == «κανένα»
d1 <- Pima [, «τύπος»] == «ναι»
base.rate.d1 <- αθροίστε (d1)/(ποσό (d1) + ποσό (d0))
glu.density <- πυκνότητα (glu)
glu.d0.density <- πυκνότητα (glu [d0])
glu.d1.density <- πυκνότητα (glu [d1])
approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f
p.d.given.glu <- λειτουργία (glu, base.rate.d1)
{
p1 <- glu.d1.f (glu) * base.rate.d1
p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
p1/(p0+p1)
}
Χ <- 1:250
Υ <- (Χ, base.rate.d1) πλοκή
p.d.given.glu (το Χ, Υ, type='l', col='red', xlab='glu', το π (διαβήτης|glu) «)
πλοκή (πυκνότητα (glu [d0]), col='blue', xlab='glu', ylab='estimate π (glu),
π (glu|διαβήτης), π (glu|όχι διαβήτης) «, main=NA)
γραμμές (πυκνότητα (glu [d1]), col='red')
γραμμές (πυκνότητα (glu))
|
Custom Search
|
© Πνευματικά δικαιώματα 2011 WorldLingo. Με την επιφύλαξη κάθε νόμιμου δικαιώματος.