@misc{oai:ir.soken.ac.jp:00000721, author = {足立, 淳 and アダチ, ジュン and ADACHI, Jun}, month = {2016-02-17, 2016-02-17}, note = {生物の核酸(DNA,RNA)の塩基配列や、タンパク質のアミノ酸配列を比較することによって、生物の系統樹(系統関係)を推定する「分子系統学」の研究をおこなった。これまでの研究から、分子データから系統樹を推定する方法の中で、最尤法は推定精度が高いことが知られていた。しかし、最尤法は他の方法に比べて圧倒的に計算量が多く、またデー夕(taxon)の数が増えると系統樹の組合せ爆発が起こり、最尤北系統樹を探索することが困難になるため、現実にはあまり使われていなかった。本研究は、最尤法による系統樹推定を実用的なものにするための新しい方法と、その方法を実装したソフトウェアの開発、そしてそれらを用いて現実のデータを解析して得られた知見からなる。
 第1章で分子系統樹推定の導入をした後、第2章では分子進化のモデリングを行った。最尤法によって分子系統樹を推定するには、塩基やアミノ酸の置換モデルをマルコフモデルとして記述する。最尤法でこれまで扱えたモデルは固定されていたが、本研究では様々な置換モデルを扱えるように、相対的な置換速度の比をあらわす相対置換頻度行列を導入し、組成率と分けて置換モデルを記述した。このモデルの特徴は、置換する配列の組成率が無限時間後にその組成率に収束することである。また、系統関係が既知のデータから相対置換頻度行列を推定することが可能なので、置換モデルを定義する相対置換頻度行列を最尤推定する方法を開発した。
 塩基配列データの場合では、ミトコンドリアのタンパク質をコードしている領域の4重縮退のコドンの3番目の座位だけを取り出し、置換モデルを最尤推定した。これらの座位は、置換が起こってもコードしているアミノ酸は変わらないので、置換に対する制約が一番緩く、現実に起きた突然変異を反映したものになっている。このデータからHKY85,TN93,General Stationary Markovの各モデルをそれぞれ推定した。AICによるとGeneral Stationary Markovモデルが一番当てはまりがよい。
 次にアミノ酸の置換モデルを最尤推定した。ミトコンドリアのゲノムは核のゲノム比べて進化速度が速いことから、比較的近縁な生物種間の系統樹推定のためによく使われているが、核のゲノムとはコドン表が異なるなどの違いがあるので、ミトコンドリア独自のアミノ酸置換確率行列の確立が望まれてきた。そこでミトコンドリアのタンパクをコードしている領域のアミノ酸配列から、アミノ酸の置換確率行列も推定した。この置換確率行列は、ミトコンドリアのデータによりフィットするため、タンパクの分子系統樹推定の精度が高まることが期待できる。 第3章は、最尤法による分子系統樹の推定法の高速化と実用化の研究である。これまでの方法と比ベ、部分系統樹の部分尤度を保存するデータ構造を変え、各パラメータをニュートン法で更新するアルゴリズムを非再帰的ループによる新しいアルゴリズムにすることによって、最尤なパラメータを推定する高速なアルゴリズムを開発した。
 OTUの数が増加すると、系統樹の2分木のトポロジィの組み合わせ数は爆発的に増大するので、すべてトポロジィの尤度を計算することは不可能になる。最尤法は最尤なパラメータを推定するためにNewton法を使用しているが、これはパラメータが収束するまで計算量の多い尤度関数を頻繁に呼び出さなければならない。そこで、パラメータ推定を計算量の少ない最小二乗法でおこない、その値を使って尤度をl度だけ計算し、それを近似尤度とすることを考えた。この近似尤度を系統樹選択の規準とする方法を「近似尤度法」と呼ぶ。近似尤度の値が上位のトポロジィだけ取り出し、その中から最尤法により最尤系統樹とそれに準ずる系統樹を得ればよい。また、最小二乗法の残差二乗和を足切りの規準として使うこともできる。
 総当たり探索ができない領域では、何らかのヒューリスティックな最尤系統樹探索法が必要になる。そこでStar decempositionと名付けた最尤系統樹探索法を考案した。始めに、全OTUが1つの仮想的なrootから同時に分岐した、Star型の系統樹を仮定する。このtfCC型の系統樹から任意のOTUのペアを近縁であると仮定しクラスターを組ませる。ペアを選ぶ全ての組合せについてその系統樹の尤度を計算し、その中であるペアの組がそのペアの一方を含んだ別の組よりも有意であれば、そのペアはクラスターを組み独立できる。
 第4章では、2、3章の研究成果を基に開発した、最方法による分子系統樹推定ソフトウェアMOLPHYについて述べてある。MOLPHYはInternet上のAnonymous FTP silcにポストし、フリープログラムとして一般に公開している。現在、海外からだけで200人以上の研究者がダウンロードするくらい需要がある。MOLPHYは、世界で唯一のタンパク質系統樹の最尤も推定プログラム”ProtM”、核酸系統樹の最尤推定プログラム”NucML”、近隣結合法のプログラムNJdist、そしてアミノ酸(塩基)配列データの基本的統計量出力プログラムProtST(NueST)等、によって構成される。また各種のユーティリティ等も開発した。
 第5章は、これまで研究開発してきた方法を用い、実際のデータを解析した応用である。「霊長類の分岐年代推定」、「ミトコンドリアのアミノ酸置換の傾向」、「クジラ目の系統解析」、「4Taxaサンプリング解析」、「Cytochrome bによる哺乳類と鳥類の系統解析」、そして、「Cylochrome Osidasc Subunit IIによる哺乳類の系統解析」等の解析を行い、新たな生物学的知見を得ている。, application/pdf, 総研大甲第110号}, title = {分子進化のモデリングと分子系統樹の最尤推定}, year = {} }