顶10篇文章乱伦Torrey DeVitto 传教士式体位 酒神(漫画) Chelsy Davy 互联网电影数据库 禁忌(影片系列) 红色诗歌选 Bea Alonzo 菲律宾老鹰 |
News: |
在 可能性 并且 统计, 密度估计 是估计的建筑,根据观察 数据一看不见强调 可能性密度函数. 看不见的密度函数被重视,当多人口被分布的密度; 数据通常被重视作为随意抽样从那人口。
使用对密度估计的各种各样的方法,包括 Parzen窗口 并且范围 数据成群 技术,包括 矢量量化.
内容 |
我们考虑发生的纪录 糖尿病. 下列从被引述逐字 数据集 描述:
在本例中,我们修建三个密度估计为“glu” (血浆 葡萄糖 集中),一个 有条件 在糖尿病出现,第二有条件在缺乏糖尿病和三不有条件在糖尿病。 有条件密度估计是然后使用修建可能性糖尿病有条件在“glu”。
“glu”数据从许多包裹得到了 R编程语言. 在之内‘R, ?Pima.tr 并且 ?Pima.te 给数据的一个全部帐户。
手段 “glu”在糖尿病事例是143.1,并且标准偏差是31.26。 “glu”手段在非糖尿病事例是110.0,并且标准偏差是24.29。 从此我们看见,在这个数据集,糖尿病案件同“glu联系在一起的”更加了不起的水平。 这将由估计的密度函数的剧情做清除器。
第一个图显示密度估计 p(glu | diabetes=1), p(glu | diabetes=0),和 p(glu)。 密度估计是仁密度估计使用一个高斯仁。 即高斯密度函数被安置在每个数据点,并且密度函数的总和被计算在数据的范围。
从密度“glu”有条件在糖尿病,我们可以得到糖尿病的可能性有条件在“glu”通过 贝斯的规则. 为简要, “糖尿病”是省略的“db”。 在这个惯例。
第二个图显示估计的事后机率 p(diabetes=1 | glu)。 从这数据,看起来“glu的”一个增加的水平同糖尿病联系在一起。
跟随命令 R编程语言 将创造显示的图以上。 这些命令可以被输入在指令提示通过使用剪贴。
图书馆(许多)
数据(Pima.tr)
数据(Pima.te)
Pima <- rbind (Pima.tr, Pima.te)
glu <- Pima [, ‘glu’]
d0 <- Pima [, ‘类型’] == ‘没有’
d1 <- Pima [, ‘类型’] == ‘是’
base.rate.d1 <-求和(d1)/(总和(d1) +总和(d0))
glu.density <-密度(glu)
glu.d0.density <-密度(glu [d0])
glu.d1.density <-密度(glu [d1])
approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f
p.d.given.glu <-作用(glu, base.rate.d1)
{
p1 <- glu.d1.f (glu) * base.rate.d1
p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
p1/(p0+p1)
}
x <- 1:250
y <- p.d.given.glu (x, base.rate.d1)
剧情(x, y, type='l', col='red', xlab='glu', ylab='estimated p (糖尿病|glu) ‘)
剧情(密度(glu [d0]), col='blue', xlab='glu', ylab='estimate p (glu),
p (glu|糖尿病), p (glu|糖尿病) ‘不是main=NA)
线(密度(glu [d1]), col='red')
线(密度(glu))
|
Custom Search
|
© 版权 2011 WorldLingo.保留所有权利。