Item type |
学位論文 / Thesis or Dissertation(1) |
公開日 |
2010-02-22 |
タイトル |
|
|
タイトル |
自己組織化学習法則による多変量解析 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_46ec |
|
資源タイプ |
thesis |
著者名 |
樋口, 勇夫
|
フリガナ |
ヒグチ, イサオ
|
著者 |
HIGUCHI, Isao
|
学位授与機関 |
|
|
|
学位授与機関名 |
総合研究大学院大学 |
学位名 |
|
|
学位名 |
博士(学術) |
学位記番号 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
総研大甲第363号 |
研究科 |
|
|
値 |
数物科学研究科 |
専攻 |
|
|
値 |
15 統計科学専攻 |
学位授与年月日 |
|
|
学位授与年月日 |
1999-03-24 |
学位授与年度 |
|
|
|
1998 |
要旨 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本論文は学習理論を応用した主成分分析の手法について理論的な考察と関連する学習アルゴリズムについての研究を行っている.近年,生物の脳をモデル化したニューラフレネットワークの理論は様々な統計手法に応用されている.しかし,そのアプローチの性能はコンピュータによる数値実験でのみ示されている場合が多く,理論的な考察は十分とは言えない.ニューラルネットワークの特徴としては,並列的な情報処理と学習のプロセスがあげられる.ニューラルネットワークでは,複数のニューロンが結合して,個々のニューロンはそれぞれ独立して情報処理を行う.各ニューロンは結合比重というパラメータを持つ.ネットワーク全体の情報処理はそれぞれのニューロンが学習によって結合比重を修正することによって行われる.<br /> 本研究について,著者はつぎのような一般的な理解の下に研究を論文をまとめている.主成分分析は多変量データの縮約の代表的な方法として幅広く用いられている.これはデータ分散行列の固有値問題に帰着される.線形ニューロンによるネットワークは学習によって主成分分析を行うことができる.その時,結合比重が主成分ベクトルに相当する.従って学習のアルゴリズムを主成分分析に応用することができる.また実際面からの有利さとして,著者はニューラルネットワークによる主成分分析はオンラインデータに対する応用が容易であることも指摘している.このような認識を基盤として,著者は以下のような具体的な問題に取り組みその理論的解決を図っている.<br /> データ分散行列は外れ値の影響を強く受ける.従って分散行列に基づいている主成分分析もロバストではない.Xu and Yuilleは外れ値の判定を行うバイナリーフィールドを導入し,ニューロンの自己組織化法則を応用することで主成分分析のロバスト化を行ったが,そのロバストネスについては数値計算の結果を示したのみで理論的な考察は行っていなかった.主成分分析のロバスト化については様々な方法が提起されていたが,代表的な方法はデータ分散行列のM - 推定量を用いる方法である.自己組織化ロノマスト主成分分析のアルゴリズムは,ある重みづけ分散行列の固有値問題へと帰着される.<br /> 一般に,ロバストネスを示す尺度として,影響関数がある.従来の主成分分析の影響関数を計算すると,データが平均から離れるほど,そのデータに対する影響関数の絶対値が無限に大きくなることが分かる.これはそのようなデータが主成分分析の結果に大きく影響を与えることを示しており,このことから従来の(古典的)主成分分析はロノマストでないといえる.自己組織化口バスト分散行列の影響関数は陽に計算できる.その結果を用いて自己組織化アルゴリズムによる統計量の影響関数も計算することができる.自己組織化アルゴリズムの影響関数は主成分ベクトルの方向を除いて,平均からのデータの距離が遠くなるほどゼロに収束する.これは影響関数が主成分ベクトルに直交する成分が大きくなると急激にゼロになるような重みがついた形になっているからである.このことから自己組織化アルゴリズムは主成分ベクトルに直交する成分に対してロノベストであることが分かる.<br /> また,Maronnaの行ったM - 推定量を用いた方法との比較も行っている.分散行列のM - 推定量は,平均からの距離が大きなデータの重みを小さくした重み付き分散行列である.これに対して,自己組織口バスト主成分分析の分散行列は,主成分ベクトルの方向に直交する成分に対して重みが小さくなる.平均から見て主成分ベクトルの方向に離れたデータは主成分ベクトルにあまり変化を与えない.このようなデータを排除しないのが自己組織化アルゴリズムの特徴であることを,影響関数の理論から示している.この重み付き分散行列に着目すると,この重みは分散行列の固有ベクトルを含んだ関数であるため,直接計算することは不可能である.そのため,これを反復計算で求めるアルゴリズムを提起している.基になる重み付き分散行列が等しいため,影響関数はXu and Yuilleのアルゴリズムと同じであり,従ってこの方法も同様のロバストネスを持つ.数値計算の結果,本論文での方法はこれまでのXu and Yuilleの方法と比べて少ない反復回数で収束することが示されている.<br /> 関連する研究として数量化理論についてつぎのことがらの考察もなされている.数量化の方法として知られる双対尺度法はデータ行列の特異値分解に帰着される.主成分分析と同様にエネルギー関数を考え,各データに対するエネルギーを定義することで,主成分分析と同様の重み付き行列を考えることができる.そこで,自己組織化法則による双対尺度法を提起し,その性質について議論している.数量化の場合,主成分分析の時のように平均から無限に離れた外れ値というものは考えにくい.この場合,自己組織化は外れ値の判定とは別の動きをすると考えられる.本論文では,数値実験の結果から,自己組織化双対尺度の性能についても考察している. |
所蔵 |
|
|
値 |
有 |
フォーマット |
|
|
内容記述タイプ |
Other |
|
内容記述 |
application/pdf |