トップ10の記事

近親相姦
くすぐりの苦悶
Nを法とした原始根
セシウム137
チェスターフィールド(タバコ)
ヨウ素131
Badoo
生物学的半減期
OllyDbg
Zeugma (都市)

News:

密度の推定

確率 そして 統計量, 密度の推定 見積もりの構造は観察されるに基づいて、ある データ、観察できない下にあることの 確率密度関数. 観察できない密度関数はについてと同時に大きい人口が配られる密度考えられる; データは通常その人口からのランダムサンプルとしてについて考えられる。

含んでいる密度の推定への色々なアプローチは使用される Parzenの窓 そして範囲の データ群がること 含んでいる技術 ベクトル量子化.

目次

密度の推定の例

私達は発生の記録をの考慮する 糖尿病. 次はから逐語的に引用される データセット 記述:

少なくとも21歳だった女性の人口、の Pima フェニックス、アリゾナの近くのインドの相続財産そして生活は糖尿病のために、に従ってテストされた 世界保健機構 規準。 データは糖尿病および消化が良いおよび腎臓病の米国の国民の協会によって集められた。 私達は532の完全な記録を使用した。

この例では、私達は組み立てる「glu」のための3つの密度の見積もりを(血しょう ブドウ糖 集中)、1つ 条件付き 糖尿病の存在、糖尿病の不在の第2条件付き、および糖尿病で条件付き三番目。 条件付き密度の見積もりはそれから「gluで」条件付き糖尿病の確率を組み立てるのに使用されているある。

「glu」データはの多くのパッケージから得られた Rのプログラミング言語. の中では「R, か。Pima.tr そして か。Pima.te データのフルアカウントを与えなさい。

平均 糖尿病の場合の「glu」 143.1はであり、標準偏差は31.26である。 非糖尿病の場合の「glu」の平均は110.0であり、標準偏差は24.29である。 これから私達は、このデータセットで、糖尿病の場合が「glu」のすばらしいレベルと関連付けられることを見る。 これは推定密度関数のプロットによってクリーナーになされる。

最初の図は密度の見積もりをの示す p(glu | diabetes=1)、 p(glu | diabetes=0)、 p(glu)。 密度の見積もりはガウス穀粒を使用して穀粒密度の見積もりである。 すなわち、ガウス密度関数は各データ点に置かれ、密度関数の合計はデータの範囲に計算される。

推定密度の p(glu | diabetes=1) (赤)、 p(glu | diabetes=0) (青)、 p(glu) (黒)。

糖尿病で条件付き「glu」の密度から私達は「gluで」を経て条件付き糖尿病の確率を得てもいい ベイズの規則. 略して、「糖尿病」はである短縮された「db」。 この方式。

第2図は推定事後確率を示す p(diabetes=1 | glu)。 これらのデータから、「glu」の増加されたレベルが糖尿病と関連付けられるようである。

推定確率の p(diabetes=1 | glu)。

例えば原稿

の続命令 Rのプログラミング言語 上で示されている図を作成する。 これらの命令はコマンド指示でカットアンドペーストの使用によって入れることができる。

図書館(多く)
データ(Pima.tr)

データ(Pima.te)

 Pima <- rbind (Pima.tr、Pima.te)の
glu <- Pima [、「glu」]

 d0 <- Pima [、「タイプ」] == 「」
 d1無し <- Pima [、「タイプ」] == 「はい」
 base.rate.d1 <-総計する(d1)/(合計(d1) +合計(d0))

glu.density <-密度(glu)
 glu.d0.density <-密度(glu [d0])
 glu.d1.density <-密度(glu [d1])

 approxfun (glu.d0.density$x、glu.d0.density$y) -> glu.d0.fの
approxfun (glu.d1.density$x、glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <-機能(glu、base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

X <- 1:250
 y <- p.d.given.glu (x、base.rate.d1)の
プロット(x、y、type='l', col='red', xlab='glu',はp (糖尿病をylab='estimated|gluの) 「)

プロット(密度(glu [d0])、col='blue', xlab='glu',のylab='estimate p (glu)、
p (glu|糖尿病)、p (glu|ない糖尿病) 「、main=NA)
ライン(密度(glu [d1])、col='red')
ライン(密度(glu))

また見なさい

参照

  • ブライアンD。 Ripley。 パターン認識およびニューラル・ネットワーク. ケンブリッジ: ケンブリッジ大学出版局1996年。
  • Trevor Hastie、ロバートTibshirani、およびJeromeフリードマン。 統計的な学習の要素. ニューヨーク: Springer 2001年。 ISBN 0-387-95284-5. (章を。見なさい第6)
  • D.W. スコット。 多変数密度の推定。 理論、練習および視覚化. ニューヨーク: ワイリー1992年。
  • B.W. Silverman。 密度の推定. ロンドン: Chapmanおよびホール1986年。
  • J.W. スミス、J.E。 Everhart、W.C。 Dickson、W.C。 KnowlerおよびR.S。 Johannes。 「糖尿病のmellitusの手始めを」予測するADAPの学習アルゴリズムを使用して。 医療のコンピュータ利用技術のシンポジウムの進行 (ワシントン州1988年)、ED。 R.A. Greenes、PP。 261-265. Los Alamitos、カリフォルニア: IEEEのコンピュータ社会の出版物1988年。

外部リンク

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence