상위 10 개 기사

체르노빌 재해
한국 전쟁
중국 숫자
폐 계면활성제
피츠버그 공립학교
영국의 강의 명부
멕시코
히브리어 성경
슬로베니아 문학
중국

News:

조밀도 의견

에서 확율 그리고 통계, 조밀도 의견 견적의 건축은 관찰하는에 근거하여, 이다 자료, 관찰할 수 없는 밑에 있기의 확률 밀도 함수. 관찰할 수 없는 밀도 함수는을 때 큰 인구가 배부되는 조밀도 생각될 것이다; 자료는 저 인구에게서 무작위 표본과로 보통 생각된다.

포함하는 조밀도 의견에 다양한 접근은 사용된다 Parzen 창 그리고 범위의 자료 밀집하기 포함하는 기술 벡터 양자화.

목차

조밀도 의견의 보기

우리는 부각의 기록을의 고려한다 당뇨병. 에서 다음과 같은 것이 축어적으로 인용된다 자료 집합 묘사:

적어도 21 살인 여자의 인구, 의 Pima 피닉스 의 애리조나의 가까이에 인도 유산 그리고 생존은 당뇨병을 위해, 에 따르면 시험되었다 세계 보건 기구 표준. 자료는 당뇨병과 소화와 신장병의 미국 국가 학회에 의해 모았다. 우리는 532의 완전한 기록을 이용했다.

이 예제에서, 우리는 건설한다 "glu"를 위한 3개 조밀도 견적을 (플라스마 포도당 농도), 것 조건 당뇨병의 존재, 당뇨병 결핍에 두번째 조건, 및 당뇨병에 조건 세 번째에. 조건적인 조밀도 견적은 그 때 "glu에" 조건 당뇨병의 확율을 건설하는 사용된다 이다.

"glu" 자료는의 대량 포장에서 얻어졌다 R 프로그램 언어. 안에 'R, ? Pima.tr 그리고 ? Pima.te 자료의 전액 예금을 주십시오.

평균 당뇨병 경우에서 "glu의" 143.1는 이고 표준 편차는 31.26이다. 비 당뇨병 경우에서 "glu"의 평균은 110.0이고 표준 편차는 24.29이다. 이것에서 우리는, 이 자료 집합에서, 당뇨병 케이스가 "glu"의 훌륭한 수준과 연관된ㄴ다는 것을 본다. 이것은 추정된 밀도 함수의 작의에 의해 개간자에게 할 것이다.

첫번째 숫자는 조밀도 견적을의 보여준다 p(glu | diabetes=1), p(glu | diabetes=0), p(glu). 조밀도 견적은 가우스 알갱이를 사용하여 알갱이 조밀도 견적이다. 다시 말하면 가우스 밀도 함수는 각 자료점에 두고, 밀도 함수의 합계는 자료의 범위에 계산된다.

추정된 조밀도의 p(glu | diabetes=1) (빨강), p(glu | diabetes=0) (파랑), p(glu) (검정).

당뇨병에 조건 "glu"의 조밀도에서, 우리는 "glu에"를 통해 조건 당뇨병의 확율을 얻어서 좋다 베이스의 규칙. 간결을 위한, "당뇨병"는이다 줄여쓴 "db." 이 공식에서.

두번째 숫자는 추정된 뒤 확율을 보여준다 p(diabetes=1 | glu). 이 자료에서, "glu"의 증가시킨 수준이 당뇨병과 연관된다 나타난다.

추정된 확율의 p(diabetes=1 | glu).

예를 들면 원본

의 따르 명령 R 프로그램 언어 상기 보인 숫자를 창조할 것이다. 이 명령어는 명령 프롬프트에 잘라 붙이기 사용해서 입력될 수 있다.

(대량) 도서관
 자료 (Pima.tr)

 자료 (Pima.te)

 Pima <- rbind (Pima.tr, Pima.te)
 glu <- Pima [, "glu"]

 d0 <- Pima [, "유형"] == "아니"
 d1 <- Pima [, "유형"] == "그렇습니다"
 base.rate.d1 <- 총계한다 (d1)/(합계 (d1) + 합계 (d0))

glu.density <- 조밀도 (glu)
 glu.d0.density <- 조밀도 (glu [d0])
 glu.d1.density <- 조밀도 (glu [d1])

 approxfun (glu.d0.density$x, glu.d0.density$y) -> glu.d0.f
 approxfun (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- 기능 (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- p.d.given.glu (x, base.rate.d1)
 작의 (x, y, type='l', col='red', xlab='glu', 는 p (당뇨병을 ylab='estimated|glu) ')

 작의 (조밀도 (glu [d0]), col='blue', xlab='glu', ylab='estimate p (glu),
 p (glu|당뇨병), p (glu|당뇨병) ', main=NA) 선
 아닙니다 (조밀도 (glu [d1]), col='red')
 선 (조밀도 (glu))

또한 보십시오

참고

  • Brian D. Ripley. 패턴 인식과 신경 네트워크. 케임브리지: 케임브리지 대학 출판 1996년.
  • Trevor Hastie, 로버트 Tibshirani, 및 Jerome Friedman. 통계적인 배우기의 성분. 뉴욕: Springer 2001년. ISBN 0-387-95284-5. (장을 보십시오 제 6.)
  • D.W. Scott. 다변량 조밀도 의견. 이론, 연습 및 구상. 뉴욕: 윌에이 1992년.
  • B.W. Silverman. 조밀도 의견. 런던: chapman와 홀 1986년.
  • J.W. 스미스, J.E. Everhart, W.C. Dickson, W.C. Knowler 및 R.S. Johannes. "당뇨병 mellitus의 개시를" 예측하는 ADAP 배우는 산법을 사용하는. 에서 치료에 있는 컴퓨터 응용 프로그램에 심포지엄의 절차 (워싱톤 1988년), 에디션. R.A. Greenes, PP. 261-265. Los Alamitos, 캘리포니아: IEEE 컴퓨터 학회 압박 1988년.

외부 연결

The original article is from Wikipedia. To view the original article please click here.
Creative Commons Licence