Top 10 artikelen

Goole
Koreaanse thee
nasza-klasa.pl
Creditcardfraude
Het zingen
Misbruik
Muziek van Indonesië
Tchiluba
De Provincie van Balkh
Provincie van Balkh Thermische straling

News:

De schatting van de dichtheid

In waarschijnlijkheid en statistieken, dichtheids schatting is de bouw van een raming, die op waargenomen wordt gebaseerd gegevens, van het onwaarneembare ten grondslag liggen aan de functie van de waarschijnlijkheidsdichtheid. De onwaarneembare dichtheidsfunctie wordt gedacht van als de dichtheid volgens dewelke een grote bevolking wordt verdeeld; de gegevens worden gewoonlijk gedacht van als willekeurige steekproef van die bevolking.

Een verscheidenheid van benaderingen van dichtheidsschatting worden gebruikt, het omvatten De vensters van Parzen en een waaier van gegevens het groeperen zich technieken, het omvatten vector kwantificatie.

Inhoud

Voorbeeld van dichtheidsschatting

Wij bespreken verslagen van de weerslag van diabetes. Het volgende wordt geciteerd woord voor woord van gegevens reeks beschrijving:

Een bevolking van vrouwen die minstens 21 jaar oud, van waren Pima De Indische erfenis en het leven dichtbij Phoenix, Arizona, werden getest voor diabetes volgens Wereldgezondheidsorganisatie criteria. De gegevens werden verzameld door het Nationale Instituut van de V.S. van Diabetes en de Spijsverterings en Ziekten van de Nier. Wij gebruikten 532 voltooien verslagen.

In dit voorbeeld, construeren wij drie dichtheidsramingen voor „glu“ (plasma glucose concentratie), voorwaardelijk op de aanwezigheid van diabetes, tweede voorwaardelijk op het ontbreken van diabetes, en het derde niet voorwaardelijk op diabetes. De voorwaardelijke dichtheidsramingen zijn dan worden gebruikt om de waarschijnlijkheid van diabetes te construeren voorwaardelijk op „glu“.

De „glu“ gegevens werden verkregen uit het pakket van de MASSA van R programmeertaal. Binnen 'R, ? Pima.tr en ? Pima.te breng vollediger verslag van de gegevens uit.

beteken van „glu“ in diabetes is de gevallen 143.1 en de standaardafwijking is 31.26. Het gemiddelde van „glu“ in de niet-diabetesgevallen is 110.0 en de standaardafwijking is 24.29. Van dit zien wij dat, in deze gegevensreeks, de diabetesgevallen met grotere niveaus van „glu“ worden geassoci�ërd. Dit zal duidelijker door percelen van de geschatte dichtheidsfuncties worden gemaakt.

Het eerste cijfer toont dichtheidsramingen van p(glu | diabetes=1), p(glu | diabetes=0), en p(glu). De dichtheidsramingen zijn de ramingen die van de pitdichtheid een Gaussian pit gebruiken. Namelijk wordt een Gaussian dichtheidsfunctie geplaatst op elk gegevenspunt, en de som dichtheidsfuncties wordt gegevens verwerkt over de waaier van de gegevens.

Geschatte dichtheid van p(glu | diabetes=1) (rood), p(glu | diabetes=0) (blauw), en p(glu) (zwarte).

Van de dichtheid van „glu“ voorwaardelijk op diabetes, kunnen wij de waarschijnlijkheid van diabetes verkrijgen voorwaardelijk op „glu“ via De regel van Bayes. Voor beknoptheid, de „diabetes wordt“ afgekort „db.“ in deze formule.

Het tweede cijfer toont de geschatte latere waarschijnlijkheid p(diabetes=1 | glu). Van deze gegevens, blijkt het dat een verhoogd niveau van „glu“ met diabetes wordt geassoci�ërd.

Geschatte waarschijnlijkheid van p(diabetes=1 | glu).

Bijvoorbeeld manuscript

Volg bevelen van R programmeertaal de hierboven getoonde cijfers zal creëren. Deze bevelen kunnen bij de bevelherinnering zijn ingegaan door cut-and-paste te gebruiken.

van bibliotheek (MASSA)
 gegevens (Pima.tr)

 de gegevens (Pima.te)

 Pima <- rbind (Pima.tr, Pima.te)
 glu <- Pima [, „glu“]

 d0 <- Pima [, „type“] == „Geen“
 d1 <- Pima [, „type“] == „ja“
 base.rate.d1 <- tel (d1)/op (som (d1) + som (d0))

glu.density <- dichtheid (glu)
 glu.d0.density <- dichtheid (glu [d0])
 glu.d1.density <- dichtheid (glu [d1])

 approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
 approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- functie (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- (x, base.rate.d1) perceel
 p.d.given.glu (x, y, type='l', col='red', xlab='glu', ylab='estimated p (diabetes|glu) ')

 perceel (dichtheid (glu [d0]), col='blue', xlab='glu', ylab='estimate p (glu),
 p (glu|diabetes), p (glu|niet diabetes) ', main=NA)
 lijnen (dichtheid (glu [d1]), col='red')
 lijnen (dichtheid (glu))

Zie ook

Verwijzingen

  • Brian D. Ripley. De Erkenning van het patroon en Neurale Netwerken. Cambridge: De Universitaire Pers van Cambridge, 1996.
  • Trevor Hastie, Robert Tibshirani, en Jerome Friedman. De elementen van het Statistische Leren. New York: Aanzetsteen, 2001. ISBN 0-387-95284-5. (Zie Hoofdstuk 6.)
  • D.W. Scott. Multivariate Schatting van de Dichtheid. Theorie, Praktijk en Visualisatie. New York: Wiley, 1992.
  • B.W. Silverman. De Schatting van de dichtheid. Londen: Chapman en Zaal, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler, en R.S. Johannes. „Gebruikend het het leren ADAP algoritme om het mellitus begin van diabetes te voorspellen“. In Werkzaamheden van het Symposium over de Toepassingen van de Computer in Medische Zorg (Washington, e-n 1988). R.A. Greenes, blz. 261-265. Los Alamitos, CA: De Pers van de Maatschappij van de Computer van IEEE, 1988.

Externe verbindingen

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence