WEKO3
アイテム
人文社会データへの統計数理的アプローチ---古代社会の家系図の復元と人口推定および語順規則による言語の分類---
https://ir.soken.ac.jp/records/1678
https://ir.soken.ac.jp/records/167896b3aaa9-998f-40e8-92b9-38b1f9443078
名前 / ファイル | ライセンス | アクション |
---|---|---|
要旨・審査要旨 (449.0 kB)
|
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2011-01-18 | |||||
タイトル | ||||||
タイトル | 人文社会データへの統計数理的アプローチ---古代社会の家系図の復元と人口推定および語順規則による言語の分類--- | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||
資源タイプ | thesis | |||||
著者名 |
上田, 澄江
× 上田, 澄江 |
|||||
フリガナ |
ウエダ, スミエ
× ウエダ, スミエ |
|||||
著者 |
UEDA, Sumie
× UEDA, Sumie |
|||||
学位授与機関 | ||||||
学位授与機関名 | 総合研究大学院大学 | |||||
学位名 | ||||||
学位名 | 博士(学術) | |||||
学位記番号 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 総研大乙第199号 | |||||
研究科 | ||||||
値 | 複合科学研究科 | |||||
専攻 | ||||||
値 | 15 統計科学専攻 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2010-03-24 | |||||
学位授与年度 | ||||||
値 | 2009 | |||||
要旨 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 本論文では(1)古代メソポタミアの遺跡に関連した考古学データ、(2)世界の130言<br />語の19項目にわたる語順表という2うの人文社会データを解析している。これらの<br />人文社会データを最適化や多変量解析などの統計数理的手法を用いて新たな視点から<br />解析し、従前の手法では得られなかった有用な知見を得ることが研究の主たる目的で<br />ある。その過程を通じて統計数理的方法論が、人文社会データの解析において今後さ<br />らに重要な役割を果たしうることが示されている。<br /> 第I部の土台となっているヌジ人名史料は、古代メソポタミアのヌジ遺跡から出土<br />した粘土板文書に記載されている個人名をまとめた書物である。この粘土板文書は主<br />に土地など財産に関する契約文書であり、その数は約4000枚である。本研究では人<br />名史料に基づき内容を再現するデータベースを作成し、このデータベースを用いて、<br />契約文書に記載される個人名とその親族関係の情報から家系図を自動的に作成する計<br />算アルゴリズムを提案している。復元された家系図と同一文書にどの人物が一緒に現<br />れるかという情報を組み合わせることにより、文書に記載される個人名の生存期間、<br />文書の成立年を推定することができ、これらを手がかりにヌジの人口の推定を試みて<br />いる。<br /> 1章では、ヌジ人名史料の出典であるヌジ遺跡とヌジ文書、そしてヌジ人名史料の<br />特徴について説明している。ヌジ人名史料は、ヌジ遺跡の粘土板文書から登場する人<br />物だけを抜き出した史料であり、本研究ではまず人名史料をコンピュータで扱えるよ<br />うにデータベース化した。ヌジ文書には契約の当事者の名前を親の名前と共に記載す<br />るという特徴があり、親子2代の家系図を容易に想定できる場合が多い。この段階で<br />想定される家系図を基本家系図と呼ぶことにする。2章ではこの基本家系図に基づく<br />より広範な家系図の再構築が試みられている。<br /> ヌジ人名史料を読み解いて家系図を復元したことによって、文書に記載される人物<br />に限定されるが、同時期に生存していた人数を推定したり、文書の成立年を推定する<br />ことが可能になった。3章では、得られた最大の家系図6代16人のTe<u>h</u>ip―tillaの家系<br />図を基準として、他の家系図と照らし合わせて、各々の家系が存在した時代を推定す<br />ることを試みている。具体的には、Te<u>h</u>ip―tillaの家系図のメンバーと文書を介して関<br />連する人物をたどり、その人物の属する家系図を特定することにより、それぞれの家<br />系が存在した時代を推定する。<br /> 4章では、凸最適化問題の一つである凸2次計画問題を用いて個々の人物の生誕年<br />と死亡年、文書の成立年を推定している。家系図から得られる親子関係を用いて親子<br />の年齢差を仮定し、また契約に関わるのに相応しい年齢を想定し、文書に記載される<br />人物の年齢を与えて制約条件とする。また、予め仮定した寿命と個々の人物の寿命と<br />の差が最小になるように目的関数を設定する。結果として22,301変数と39,311制約<br />式をもつ凸2次計画問題が得られ、主双対内点法によりこの問題を解いて個々の人物<br />の生誕年、死亡年、文書の成立年の推定値を求めることができる。得られた推定値は、<br />3章で得られた結果が世代間の比較であるのに対して、人物一人ひとりの年齢を推定<br />するものであり、より詳細な情報を含む。これらに基づき文書に記載されるヌジ名の<br />存在した年代や人口動態、契約文書の変遷等の穐々な情報が得られる。特に文書に登<br />場する人物は8,000~9000人が同時期に生きていたと思われることが明らかになる。<br />この結果は3章で得られた結果とも整合性のあるものである。<br /> 第5章では第4章までに得られた結果を検討してヌジには裁定20000人程度が居住<br />していたと結論し、そして考古学的に得られている知見とも合わせて集落の個数や領<br />域の面積等についても考察している。さらに、推定された契約文書の成立年代による<br />契約文書の種類の変遷についても検討を行っている。<br /> 第II部でとり上げた世界の130言語の語順の表の解析では、言語学者の角田太作<br />博士によって調べられた語順表が土台となっている。言語類型論は世界の諸言語を比<br />較することにより、諸言語間で普遍的な法則性と異同を調べ、各言語に固有の特徴を<br />とらえようとするものである。角田は多くの言語の比較に努め、世界の130言語の語<br />順を19項目に亘って語順表にまとめた。語順表には、1つの語順項目に対して2つ以<br />上の語順がある言語が多々存在する。その場合には、その言語でより普通と思われる<br />語順が先に示されている。複数の語順が使用される割合は個々の言語に特有なもので<br />あると思われるが、それぞれの言語に対して適切な数値を割り当てることは困難であ<br />る。そこで本論文では、すべての言語に共通のある妥当と思われる基準を設け、それ<br />に沿った機械的に語順の数値化を試みている。語順規則による言語の解析はこのよう<br />に様々な言語に対して個々に斟酌することなく語順を数値化して得られた結果である。<br /> 6章では、語順表の数値化の方法について述べ、続いて130言語のうちアジア・ヨー<br />ロッパ地域に限定した50言語の語順に対して階層クラスタ分析を行った結果につい<br />て述べている。<br /> 7章では、世界の130言語の語順に対して階層クラスタ分析と主成分分析を試み、階<br />層的クラスター分析の結果に基づいてAICによる分割表における変数選択の方法を<br />用いて言語を7つのグループに分類し、さらに言語の分類に最適な項目について検討<br />している。解析の結果として、言語類型論の分野で世界の言語を2分割する指標とし<br />て重要視されてきた"名詞と側置詞"の語順について、従来は、前置詞言語と後置詞言<br />語と側置詞を持たない言語の3つに分類されてきたが、後者2つが一つのグループに<br />まとめられることが明らかになった。さらに"名詞と側置詞"の語順に次ぐ、言語分類<br />上の第2の指標を見出すことを試みている。そのために階層クラスタ分析で得られた<br />便宜的なグループ分割を用い、それらのグループを構成するために必要な項目を選択<br />することを試み、また逆に選択された項目を用いて構成されたグループの特徴につい<br />て考察している。これらには分割表データにおける変数選択の方法を用いた。結果は、<br />第2の指標として"数詞と名詞"の語順の項目が選ばれる。"名詞と側置詞"および"数<br />詞と名詞"の語順項目による4グループ分割は、日本語、タイ語、英語を明確に分け<br />るものになっている。 | |||||
所蔵 | ||||||
値 | 有 |