Top 10 artigos

Goole
Hotmail
Lista dos países onde o inglês é uma língua oficial
Lista de doenças mentais
Gmail
Família real britânica
Googol
Tuenti
Tsunami
KGB

News:

Estimation da densidade

Em probabilidade e statistics, estimation da densidade é a construção de uma estimativa, baseada no observado dados, de um subjacente unobservable função da densidade da probabilidade. A função unobservable da densidade é pensada de enquanto a densidade de acordo com que uma população grande está distribuída; os dados são pensados geralmente como de um amostra aleatória dessa população.

Uma variedade das aproximações ao estimation da densidade é usada, incluindo Janelas de Parzen e uma escala de aglomerar-se dos dados técnicas, incluindo quantização do vetor.

Índices

Exemplo do estimation da densidade

Nós consideramos registros da incidência de diabetes. O seguinte é citado verbatim do série de dados descrição:

Uma população das mulheres que tinham pelo menos 21 anos velhas, de Pima O heritage e a vida Indian perto de Phoenix, Arizona, foram testados para o diabetes de acordo com Organização de saúde de mundo critérios. Os dados foram coletados pelo instituto nacional dos E.U. do Diabetes e das doenças digestivas e do Kidney. Nós usamos os 532 registros completos.

Neste exemplo, nós construímos três estimativas da densidade para o “glu” (plasma glucose concentração), uma condicional na presença do diabetes, no segundo condicional na ausência do diabetes, e no condicional do third não no diabetes. As estimativas condicionais da densidade são sejam usadas então construir a probabilidade do condicional do diabetes no “glu”.

Os dados do “glu” foram obtidos do pacote MACIÇO do Língua de programação de R. Dentro 'R, ? Pima.tr e ? Pima.te dê um cliente mais cheio dos dados.

meio do “glu” nos exemplos do diabetes são 143.1 e o desvio padrão é 31.26. O meio do “glu” nos exemplos do non-diabetes é 110.0 e o desvio padrão é 24.29. Deste nós vemos que, nesta série de dados, os casos do diabetes estão associados com os níveis mais grandes do “glu”. Isto será feito a clearer por lotes das funções estimadas da densidade.

A primeira figura mostra estimativas da densidade de p(glu | diabetes=1), p(glu | diabetes=0), e p(glu). As estimativas da densidade são estimativas da densidade da semente usando uma semente Gaussian. Isto é, uma função Gaussian da densidade é colocada em cada ponto de dados, e a soma das funções da densidade é computada sobre a escala dos dados.

Densidade estimada de p(glu | diabetes=1) (vermelho), p(glu | diabetes=0) (azul), e p(glu) (preto).

Da densidade do condicional do “glu” no diabetes, nós podemos obter a probabilidade do condicional do diabetes no “glu” através de Régua de Bayes. Para a brevidade, o “diabetes” é “DB abreviado.” nesta fórmula.

A segunda figura mostra a probabilidade posterior estimada p(diabetes=1 | glu). Destes dados, parece que um nível aumentado do “glu” está associado com o diabetes.

Probabilidade estimada de p(diabetes=1 | glu).

Certificado por exemplo

Os comandos seguir do Língua de programação de R criará as figuras mostradas acima. Estes comandos podem ser incorporados no alerta de comando usando o corte e a pasta.

biblioteca (MACIÇO)
 dados (Pima.tr)

 dados (Pima.te)

 Pima <- glu do rbind (Pima.tr, Pima.te
) <- Pima [, “glu”]

 d0 <- == “não” d1 de Pima [, “tipo”
] <- Pima [, “tipo”] == “sim”
 base.rate.d1 <- soma (d1)/(soma (d1) + soma (d0))

glu.density <- densidade (glu)
 glu.d0.density <- densidade (glu [d0])
 glu.d1.density <- approxfun da densidade (glu [d1]

) (glu.d0.density$x, glu.d0.density$y) -> approxfun
 de glu.d0.f (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- função (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- lote de p.d.given.glu (x, base.rate.d1
) (x, y, type='l', col='red', xlab='glu', ylab='estimated p (diabetes|lote do glu) '

) (densidade (glu [d0]), ylab='estimate p de col='blue', xlab='glu', (glu),
 p (glu|diabetes), p (glu|não diabetes) ', linhas do main=NA
) (densidade (glu [d1]), linhas
 do col='red') (densidade (glu))

Veja também

Referências

  • Brian D. Ripley. Recognition de teste padrão e redes Neural. Cambridge: Imprensa da universidade de Cambridge, 1996.
  • Trevor Hastie, Robert Tibshirani, e Jerome Friedman. Os elementos da aprendizagem estatística. New York: Springer, 2001. ISBN 0-387-95284-5. (Veja o capítulo 6.)
  • D.W. Scott. Estimation Multivariate da densidade. Teoria, prática e Visualization. New York: Wiley, 1992.
  • B.W. Silverman. Estimation da densidade. Londres: Chapman e Salão, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler, e R.S. Johannes. “Usando o algoritmo de aprendizagem de ADAP prever o início do mellitus do diabetes”. Em Continuações do Symposium em aplicações de computador no cuidado médico (Washington, 1988), ed. R.A. Greenes, pp. 261-265. Los Alamitos, CA: Imprensa da sociedade do computador de IEEE, 1988.

Ligações externas

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence