[自在]次元の呪いと球面集中現象

2015/01/21

PRML(パターン認識と機械学習)を読んでいて、高次元になると低次元の常識が通じなくなる事例として、「高次元では球のほとんどの体積は表面に近い薄皮部に集中している!」と書かれているのだけど、最初まったく理解できなかった。

「なにそれ?メロンパンの皮だけ食べたいって話?」

考えてみると、こういうことだなと思った。

2次元の円の面積は$\pi r^2$

3次元の球の体積は$\frac{4}{3}\pi r^3$

ここからn次元の球体の体積は$c_n \pi r^n$($c_n$はnに依存する定数)と推測される。(厳密な証明ではないけど。)
例えば、n=20のn次元球体を考え、rを0から1まで変化させたとき、体積の推移はどうなるか?
rのn乗は、0に近いときは限りなく0に近く、1に近くなったときに急激に1に近い数字となる。これが球面集中現象だな。

ガウシアンカーネル法とかの意味もわかってきて、機械学習の方法が段々とわかってきた気がする。問題は、これを実践にどう応用するかだな。

追伸:
MathJaxを使って書き直してみました。数式書くのに非常に便利だな。

IMG 2050

パターン認識と機械学習 上
C.M. ビショップ
丸善出版
売り上げランキング: 19,773


パターン認識と機械学習 下 (ベイズ理論による統計的予測)
C.M. ビショップ
丸善出版
売り上げランキング: 21,018