トップ10の記事近親相姦くすぐりの苦悶 Nを法とした原始根 セシウム137 チェスターフィールド(タバコ) ヨウ素131 Badoo 生物学的半減期 OllyDbg Zeugma (都市) |
News: |
確率 そして 統計量, 密度の推定 見積もりの構造は観察されるに基づいて、ある データ、観察できない下にあることの 確率密度関数. 観察できない密度関数はについてと同時に大きい人口が配られる密度考えられる; データは通常その人口からのランダムサンプルとしてについて考えられる。
含んでいる密度の推定への色々なアプローチは使用される Parzenの窓 そして範囲の データ群がること 含んでいる技術 ベクトル量子化.
目次 |
私達は発生の記録をの考慮する 糖尿病. 次はから逐語的に引用される データセット 記述:
この例では、私達は組み立てる「glu」のための3つの密度の見積もりを(血しょう ブドウ糖 集中)、1つ 条件付き 糖尿病の存在、糖尿病の不在の第2条件付き、および糖尿病で条件付き三番目。 条件付き密度の見積もりはそれから「gluで」条件付き糖尿病の確率を組み立てるのに使用されているある。
「glu」データはの多くのパッケージから得られた Rのプログラミング言語. の中では「R, か。Pima.tr そして か。Pima.te データのフルアカウントを与えなさい。
平均 糖尿病の場合の「glu」 143.1はであり、標準偏差は31.26である。 非糖尿病の場合の「glu」の平均は110.0であり、標準偏差は24.29である。 これから私達は、このデータセットで、糖尿病の場合が「glu」のすばらしいレベルと関連付けられることを見る。 これは推定密度関数のプロットによってクリーナーになされる。
最初の図は密度の見積もりをの示す p(glu | diabetes=1)、 p(glu | diabetes=0)、 p(glu)。 密度の見積もりはガウス穀粒を使用して穀粒密度の見積もりである。 すなわち、ガウス密度関数は各データ点に置かれ、密度関数の合計はデータの範囲に計算される。
糖尿病で条件付き「glu」の密度から私達は「gluで」を経て条件付き糖尿病の確率を得てもいい ベイズの規則. 略して、「糖尿病」はである短縮された「db」。 この方式。
第2図は推定事後確率を示す p(diabetes=1 | glu)。 これらのデータから、「glu」の増加されたレベルが糖尿病と関連付けられるようである。
の続命令 Rのプログラミング言語 上で示されている図を作成する。 これらの命令はコマンド指示でカットアンドペーストの使用によって入れることができる。
図書館(多く)
データ(Pima.tr)
データ(Pima.te)
Pima <- rbind (Pima.tr、Pima.te)の
glu <- Pima [、「glu」]
d0 <- Pima [、「タイプ」] == 「」
d1無し <- Pima [、「タイプ」] == 「はい」
base.rate.d1 <-総計する(d1)/(合計(d1) +合計(d0))
glu.density <-密度(glu)
glu.d0.density <-密度(glu [d0])
glu.d1.density <-密度(glu [d1])
approxfun (glu.d0.density$x、glu.d0.density$y) -> glu.d0.fの
approxfun (glu.d1.density$x、glu.d1.density$y) -> glu.d1.f
p.d.given.glu <-機能(glu、base.rate.d1)
{
p1 <- glu.d1.f (glu) * base.rate.d1
p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
p1/(p0+p1)
}
X <- 1:250
y <- p.d.given.glu (x、base.rate.d1)の
プロット(x、y、type='l', col='red', xlab='glu',はp (糖尿病をylab='estimated|gluの) 「)
プロット(密度(glu [d0])、col='blue', xlab='glu',のylab='estimate p (glu)、
p (glu|糖尿病)、p (glu|ない糖尿病) 「、main=NA)
ライン(密度(glu [d1])、col='red')
ライン(密度(glu))
|
Custom Search
|
© Copyright 2011 WorldLingo. All rights reserved.