アブストラクト

セッション3:ブートストラップ

汪金芳(千葉大学)

Failure of Bootstrap in Matched Sampling

観察研究における因果効果の推定のため,Neyman-Rubin の反事実的因果モデルがよく用いられる.平均的因果効果を推定するために,照合推定量 (matching estimator) が最もよく使われる推定量の1つである.Unconfoundedness の仮定の下で, 共変量に1次元の連続型確率変数を含む場合, Abadie and Imbens (2006) は,照合推定量は漸近的に不偏性を持ち,また正規分布に分布収束することを証明した. 照合推定量の分散を理論的に導出することが一般に困難であるため,ブートストラップ法がしばしば適用されている.ところが,最近 Abadie and Imbens (2008) は, 照合推定量にブートストラップ法を適用したときの分散推定量が一致性を持たないことを,ある種の状況の下で証明した.この講演では,ブートストラップ法をこのような`正則な'推定量に適用したときのこのような稀な性質を紹介する.また,Abadie and Imbens (2006) におけるブートストラップ法は不自然なところがあり,講演ではシミュレーションなどを用いて,modified bootstrap によって、一致推定量が得られる可能性について考察を与える.


前園宜彦(九州大学)

反復ブートストラップ法とその近似について

ブートストラップ法は統計量の分布や構造等が明示的に求まらなくても適用できる汎用性を持った手法であるが,汎用性が高い分,推測の精度が落ちる場合もある.そこで推測の精度の改善のためにいろいろな手法が提案されており,その一つがブートストラップ反復法である.この反復法は原理的にはすべての統計的推測に適用可能であるが,計算負荷が大きくなる欠点がある.これを補うために,計算負荷はそれほど大きくなく,反復法と同じ精度が保障されるweighted-bootstrap 法による近似が提案されている.本講演では信頼区間の構成について反復法とその近似についてレビューする.


下平英寿 (東京工業大学)

マルチスケール・ブートストラップ法によるランダムネスの測定

将来予測や未知量の推定値(一般にデータから「計算」によって得た結果)をどれほど信頼できるのか? データにはランダムネスがあることを考慮して,計算結果の信頼度を統計的な確率値として求める手法を紹介する.ひとつのデータから多数のデータを生成する確率シミュレーション(ブートストラップ法)を利用すると,素朴な確率値が事象の頻度として得られる.しかし誤った結論を過大評価してしまう問題があった.本講演で紹介する手法(マルチスケール・ブートストラップ法)は,このバイアスをほぼゼロにすることに成功した.事象の頻度をそのまま使うのではなく,データサイズを変化させたときの変化率こそがバイアスゼロの信頼度に重要な役割を果たす.アルゴリズムは容易に実装できて,生物学の一分野において頻繁に利用されている.データサイズ(データの要素数)をnとおくと,ブートストラップ法では各要素に1/nの確率を割り当ててランダムに要素を取り出していきデータサイズmの複製をつくる.通常はm = nとおいて複製データを多数生成する.バラツキの程度をあらわすスケールはm に反比例するので,信頼度を求めるには一見してm = nとすべきであるにもかかわらずmを意図的に変化させるところが本手法のアイデアである.しかも,信頼度のバイアスをゼロにするには,形式的にm = −nとすればよいことが証明された.この新しい原理より得られたマルチスケール・ブートストラップ法では,nの周辺でmを変化させてランダムネスを測定し,それをm = −nへ外挿する.不合理にさえ思える負のデータサイズを考えるところがむしろ興味深いが,実は信号処理の「逆フィルタ」と数理的な関連もある.


植木優夫(統計数理研究所)・笛田薫(岡山大学)

ブートストラップ法を用いた予測区間とその応用

過去のデータを用いて構成された予測区間は,将来の変動のために偏った被覆確率をもつことが知られている.これはリスクが過小評価されていることを意味し,危険性を減らすための処置が必要となる.本発表では,ブートストラップ法による偏りの補正法を与え,予測区間の高精度化を行う.さらにその補正法をHill推定量に基づくバリュー・アット・リスク(VaR)へと応用し,実際の株価データへと適用する.結果は当日報告する.