WEKO3
アイテム
Multivariate Analysis to Explore Latent Structure by Minimum Beta-Divergence Method
https://ir.soken.ac.jp/records/772
https://ir.soken.ac.jp/records/7721ad74a33-6a80-4da3-81bd-f0f0c3d7491a
名前 / ファイル | ライセンス | アクション |
---|---|---|
要旨・審査要旨 (288.6 kB)
|
||
本文 (14.4 MB)
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2010-02-22 | |||||
タイトル | ||||||
タイトル | Multivariate Analysis to Explore Latent Structure by Minimum Beta-Divergence Method | |||||
タイトル | ||||||
タイトル | Multivariate Analysis to Explore Latent Structure by Minimum Beta-Divergence Method | |||||
言語 | en | |||||
言語 | ||||||
言語 | eng | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||
資源タイプ | thesis | |||||
著者名 |
MOLLAH, Md. Nurul Haque
× MOLLAH, Md. Nurul Haque |
|||||
フリガナ |
モーラ, モハマド ヌルル
× モーラ, モハマド ヌルル |
|||||
著者 |
MOLLAH, Md. Nurul Haque
× MOLLAH, Md. Nurul Haque |
|||||
学位授与機関 | ||||||
学位授与機関名 | 総合研究大学院大学 | |||||
学位名 | ||||||
学位名 | 博士(統計科学) | |||||
学位記番号 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 総研大甲第901号 | |||||
研究科 | ||||||
値 | 複合科学研究科 | |||||
専攻 | ||||||
値 | 15 統計科学専攻 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2005-09-30 | |||||
学位授与年度 | ||||||
値 | 2005 | |||||
要旨 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 申請論文は8章からなる。第1章は全体の構成を説明し、第2章では主成分分析、因子分析、射影追跡法など線形変換による古典的な多変量解析について2次情報(分散構造)のみを使う手法、高次情報を使う方法に分けて総合的なレポートをまとめている。第3章は独立成分分析につして、その基本概念、これまでに提案された諸々の手法、これらの手法の問題点などの総合報告をしている。<br /> 次の3章がMollahさんの独自な研究をまとめた本論文の主要部分であり、いずれの章においてもβダイバージェンスを用いた手法を提案している。βダイバージェンスは分布間の距離を測る尺度であるが、分布から外れたデータ点(外れ値)が存在するときにその影響をあまり強く受けないという特徴がある。最小βダイバージェンス(推定)法はデータの分布とモデル分布とのβダイバージェンスを最小にするパラメータの値を推定値とする方法であり、推定値は外れ値の影響をあまり受けない。第4章ではこの特徴を活かした頑健な推定方法、第5、6章ではこの特徴を発展的に活かし、局所的な構造をその構造に含まれないデー夕点の影響を受けずに柔軟に推定する手法を提案している。<br /> 第4章は、PastICAなどの独立成分分析手法で必要とされる前処理のホウイトニング(球状化)に対して改良の提案をしている。従来の方法では外れ値があるとその影響を受けてホワイトニングが適切に行われず復元行列がうまく推定できないという問題があった。本論文では最小βダイバージェンス法を用いて平均ベクトルと分散行列を推定しホワイトニングする方法を提案し、その影響関数を求め頑健性を理論的にも示している。最小βダイバージェンス法におけるチューニング・パラメータβの値は0に近いほど有効性が高いが、大きいほど頑健性が上がる。与えられたデータに対し、できるだけ有効性を失わずかつ頑健性を持つ適切なβの値を選択するためにK重交互検証法を使ってβの値を適応的に求める方法を提案した。数値的な比較実験においてその有用性を確認し、音声データの解析結果においても優れた性能を示した。 <br /> 第5章は、データ空間の潜在的な構造が大域的ではなく強い空間依存性を持っている場合の主成分分析法を提案している。空間内に複数の潜在構造があるモデルとしてはTipping and Bishop(1997, 1999)によるmixture PCAモデルとしてのアプローが、本論文で提案する方法はβダイバージェンスと空間局所性の感受性を高めるために局所尤度の考えを援用し、逐次的に局所的な主成分構造を捉える。β ダイバージェンスは外れ値の影響を受けにくいという特徴があるが、本章の問題設定においては、局所的な潜在構造に従わないデータ点は外れ値と同様にその構造の推定に影響を与えないよう低いウェイトが与えられる。逐次的な探索を停止するための基準にはウェイトの合計がある一定の値以上であるデータ点の割合、つまりいずれかの構造に含まれると判断されるデータ点の割合を用いることを提案している。また、各局所構造を推定する際に重要となる局所尤度の中心と位置パラメータの初期値の選択に対しても工夫がされている。コンポーネント数を予め与えずともよく、どの成分にも含まれない外れ値がある場合でも影響を受けずに主成分構造が捉えられるなど、従来の方法にはない利点があり、音声データ、高次元データ、コンポーネント数の多いデータに対する数値実験によってもこれらを示し、提案する方法の有用性を示した。<br /> 第6章は、第5章と同様に潜在構造が局所的な場合における独立成分分析手法を提案している。Te-Won Lee et al。(2000)はmixture ICAモデルとして混合正規モデルに対するEMアルゴリズムと似た方法を提案したが、コンポーネント数の推定などに困難な点が指摘されている。本論文では次のような探索的で柔軟な方法を提案している。最初に、適当な観測ベクトルを1つ取り、それを原点として頑健な方法を用いて混合行列を推定する。このとき、その原点回りの構造が強ければ、原点に近いデー夕だけをもとに学習することになる。次に外れ値として判断された残りのデータの中から、観測ベクトルを1つ取って原点とし、同様の解析を行う。この操作を繰り返し、ウェイトによる前章と同様の規準が満たされるまで続ける。これにより、局所的な潜在構造が逐次的に探索される。また、あらかじめコンポーネント数を与える必要もない。頑健な方法としては最小βダイバージェンス法を用い、βの値は前章と同様にK重交互検証法によって適応的に求めている。数値実験では音声データや高次データを含むいくつかのデータを用いて従来の方法と比較し優れた点があることを示した。<br /> 第7章ではFastICAと同様に逐次的に独立成分を推定する頑健な推定法を含め、今後の研究課題をぃくつか上げ、第8章で全体のまとめを述べている。 | |||||
所蔵 | ||||||
値 | 有 |