大滝厚・堀江宥治・Dan Steinberg(1998)応用2進木解析法-CARTによる-.日科技連出版社. このような説明は,他にも何処かで読んだような気がするが,Stone は Efron に直接聴いた話として紹介しているのだろうか?. cross-validation に対する邦訳はおよそ2つある. (1)交差妥当化 (2)相互検証法 である.クロスバリデーションを広義にとらえると,その具体的方法は,おそらく3つあり (1)ホールドアウト法 (2)ジャックナイフ法 (3)ブートストラップ法 である. ホールドアウトは標本をランダムに2分割し,一方をモデル構成(母数の推定)に使い,そこで得たモデル(母数)を他方のデータに対しては適用し,モデルの良さを検証する.簡単なので判別分析を中心に昔から実施されていたが,標本サイズがかなり(分割しても十分に)大きい必要がある.狭義にはこれをクロスバリデーションという. ジャックナイフは,複数の方法がある.判別分析などでは,標本サイズ n のデータセットに対して, n-1 個を使ってモデル構成して,残しておいた1個のデータに対してモデルを適用して結果を判定する−−という作業を順番にn回実施する. ブートストラップは,標本サイズ n のデータセットから,同じくサイズ n の新しい標本を復元抽出して母数を推定する−−という作業をB回(通常はB=2000程度)実行する. 「他人の助けを借りないで自分で,靴紐を交互にフックにかけて編上げていく」という比喩はジャックナイフにはふさわしいと感じることができるが,ブートストラップに対しては違和感がある. |