l8l技術メモ

機械学習・深層学習・組込みとかのメモ

PRML2章メモ カーネル密度推定

PRML2章


密度推定においては、
ヒストグラム法よりカーネル密度推定や最近傍法が優れている。
ハンド幅BW(平滑化係数)について、推定密度 p(x|X,bw) のデータノイズへ過敏さと過剰な平滑化の間のトレードオフがある。

 

BWの選択としては、CV(クロスバリデーション)を用いるか、ヒューリスティックな方法としてsilvermanやscottの方法が使える。

 

 

■ 補足リンク:

 

〇 BWの選択について

"データ解析 第十回「ノンパラメトリック密度推定法」"

http://ibis.t.u-tokyo.ac.jp/suzuki/lecture/2015/dataanalysis/L9.pdf

 

〇 既存実装

"Pythonカーネル密度推定(KDE)について調べたまとめ"

https://vaaaaaanquish.hatenablog.com/entry/2017/10/29/181949

-> scipyにはガウス窓を用いたカーネル密度推定の実装がある。BW選定方法としては、silvermanの方法とscottの方法が選べる