顶10篇文章

乱伦
Torrey DeVitto
传教士式体位
酒神(漫画)
Chelsy Davy
互联网电影数据库
禁忌(影片系列)
红色诗歌选
Bea Alonzo
菲律宾老鹰

News:

密度估计

可能性 并且 统计, 密度估计 是估计的建筑,根据观察 数据一看不见强调 可能性密度函数. 看不见的密度函数被重视,当多人口被分布的密度; 数据通常被重视作为随意抽样从那人口。

使用对密度估计的各种各样的方法,包括 Parzen窗口 并且范围 数据成群 技术,包括 矢量量化.

内容

密度估计的例子

我们考虑发生的纪录 糖尿病. 下列从被引述逐字 数据集 描述:

是至少21年妇女的人口, Pima 印第安遗产和生活在菲尼斯,亚利桑那附近,为糖尿病被测试了根据 世界卫生组织 标准。 数据由糖尿病和消化和肾病美国全国学院收集。 我们使用了532个完全纪录。

在本例中,我们修建三个密度估计为“glu” (血浆 葡萄糖 集中),一个 有条件 在糖尿病出现,第二有条件在缺乏糖尿病和三不有条件在糖尿病。 有条件密度估计是然后使用修建可能性糖尿病有条件在“glu”。

“glu”数据从许多包裹得到了 R编程语言. 在之内‘R, ?Pima.tr 并且 ?Pima.te 给数据的一个全部帐户。

手段 “glu”在糖尿病事例是143.1,并且标准偏差是31.26。 “glu”手段在非糖尿病事例是110.0,并且标准偏差是24.29。 从此我们看见,在这个数据集,糖尿病案件同“glu联系在一起的”更加了不起的水平。 这将由估计的密度函数的剧情做清除器。

第一个图显示密度估计 p(glu | diabetes=1), p(glu | diabetes=0),和 p(glu)。 密度估计是仁密度估计使用一个高斯仁。 即高斯密度函数被安置在每个数据点,并且密度函数的总和被计算在数据的范围。

估计的密度 p(glu | diabetes=1) (红色), p(glu | diabetes=0) (蓝色),和 p(glu) (黑色)。

从密度“glu”有条件在糖尿病,我们可以得到糖尿病的可能性有条件在“glu”通过 贝斯的规则. 为简要, “糖尿病”是省略的“db”。 在这个惯例。

第二个图显示估计的事后机率 p(diabetes=1 | glu)。 从这数据,看起来“glu的”一个增加的水平同糖尿病联系在一起。

估计的可能性 p(diabetes=1 | glu)。

例如剧本

跟随命令 R编程语言 将创造显示的图以上。 这些命令可以被输入在指令提示通过使用剪贴。

图书馆(许多)
数据(Pima.tr)

数据(Pima.te)

 Pima <- rbind (Pima.tr, Pima.te)
 glu <- Pima [, ‘glu’]

 d0 <- Pima [, ‘类型’] == ‘没有’
 d1 <- Pima [, ‘类型’] == ‘是’
 base.rate.d1 <-求和(d1)/(总和(d1) +总和(d0))

glu.density <-密度(glu)
 glu.d0.density <-密度(glu [d0])
 glu.d1.density <-密度(glu [d1])

 approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
 approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <-作用(glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- p.d.given.glu (x, base.rate.d1)
剧情(x, y, type='l', col='red', xlab='glu', ylab='estimated p (糖尿病|glu) ‘)

剧情(密度(glu [d0]), col='blue', xlab='glu', ylab='estimate p (glu),
 p (glu|糖尿病), p (glu|糖尿病) ‘不是main=NA)
线(密度(glu [d1]), col='red')
线(密度(glu))

参见

参考

  • 布赖恩D。 Ripley。 图案识别和神经网络. 剑桥: 剑桥大学出版社1996年。
  • Trevor Hastie,罗伯特Tibshirani和Jerome弗里德曼。 统计学会的元素. 纽约: Springer 2001年。 国际标准书号0-387-95284-5. (参见第6章。)
  • D.W. 斯科特。 多维分布的密度估计。 理论、实践和形象化. 纽约: 威里1992年。
  • B.W. Silverman。 密度估计. 伦敦: chapman和霍尔1986年。
  • J.W. 史密斯, J.E。 Everhart, W.C。 Dickson, W.C。 Knowler和R.S。 Johannes。 “使用ADAP学习算法展望糖尿病mellitus起始”。 在 讨论会的行动在计算机应用在卫生保健 (华盛顿1988),编辑。 R.A. Greenes,页。 261-265. Los Alamitos,加州: IEEE计算机协会新闻1988年。

外部链接

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence