WEKO3
アイテム
{"_buckets": {"deposit": "847a4e54-3dd0-4d7f-a37f-e9b84b7af6fe"}, "_deposit": {"created_by": 1, "id": "837", "owners": [1], "pid": {"revision_id": 0, "type": "depid", "value": "837"}, "status": "published"}, "_oai": {"id": "oai:ir.soken.ac.jp:00000837", "sets": ["19"]}, "author_link": ["0", "0", "0"], "item_1_biblio_info_21": {"attribute_name": "書誌情報(ソート用)", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2005-03-24", "bibliographicIssueDateType": "Issued"}, "bibliographic_titles": [{}]}]}, "item_1_creator_2": {"attribute_name": "著者名", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "関, 洋平"}], "nameIdentifiers": [{"nameIdentifier": "0", "nameIdentifierScheme": "WEKO"}]}]}, "item_1_creator_3": {"attribute_name": "フリガナ", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "セキ, ヨウヘイ"}], "nameIdentifiers": [{"nameIdentifier": "0", "nameIdentifierScheme": "WEKO"}]}]}, "item_1_date_granted_11": {"attribute_name": "学位授与年月日", "attribute_value_mlt": [{"subitem_dategranted": "2005-03-24"}]}, "item_1_degree_grantor_5": {"attribute_name": "学位授与機関", "attribute_value_mlt": [{"subitem_degreegrantor": [{"subitem_degreegrantor_name": "総合研究大学院大学"}]}]}, "item_1_degree_name_6": {"attribute_name": "学位名", "attribute_value_mlt": [{"subitem_degreename": "博士(情報学)"}]}, "item_1_description_1": {"attribute_name": "ID", "attribute_value_mlt": [{"subitem_description": "2005036", "subitem_description_type": "Other"}]}, "item_1_description_12": {"attribute_name": "要旨", "attribute_value_mlt": [{"subitem_description": " 本論文では,文書ジャンルとテキスト構造を用いた自動要約の新たな手法を提案し,その有効性を検証した.文書ジャンルとは,日記や報告書のような文書の種類を意味する.また,テキスト構造は,テキスト全体に対する各文の果たしている役割や機能を構成要素として捉えてテキストの構成を説明する機能構造に着目した.このような構造は,その文書ジャンルのテキストに含まれる典型的な構成要素,テキストにおける構成要素の一般的な出現順序,構成要素間の関係などによって決まる.本研究では,この文書ジャンルとテキスト構造を要約作成のための元文書からの重要箇所抽出と要約文生成に用いた.\u003cbr /\u003e 従来の自動要約研究では,主として文書中での内容語の出現頻度等を手がかりとして文書の話題に着目した要約作成を目指してきた.これらの研究は,作成された要約が内容のバランスと文章としての一貫性に欠け,また,ある話題について,たとえば事実を知りたいのか,意見を知りたいのかといった利用者が重視する情報のタイプの違いなどを扱うことはできず,利用者の情報要求における話題以外の側面に柔軟に応じることが難しいという問題があった.\u003cbr /\u003e それに対し,本論文は,文書の話題だけではなく,情報のタイプ(例えば,意見か,事実報告かなど)をも区別した要約作成という新しい課題を提起し,内容語の出現頻度とともに,文書ジャンルとテキスト構造に着目した新たな手法を提案した.そして,実験によって,提案手法が,利用者の重視する話題と情報のタイプ(例えば,意見を知りたいのか,事実を知りたいのかなど)に応じた要約作成,元文書からのバランスよい内容抽出,要約文の一貫性の向上において有効であることを示した.具体的には,以下の3点について研究を行なった.\u003cbr /\u003e A)元文書からバランスよく内容を抽出した要約の作成\u003cbr /\u003e B)どういう種類の情報を知りたいか(意見を知りたいのか,事実を知りたいのか,知識を知りたいのか)を区別した要約作成\u003cbr /\u003e C)書き手や読み手にとって自然な構成をもった要約文の生成\u003cbr /\u003e 本論文を構成する研究テーマとして,以下の3つを取り上げた.\u003cbr /\u003e\u003cbr /\u003eA.テキスト構造を用いた単一文書要約:解説記事の携帯電話向け要約を例として\u003cbr /\u003e 研究Aと研究Bでは,元文書における語の出現頻度とともに,文書ジャンルとテキスト構造を用いて要約に含める重要箇所を抽出する自動要約手法について取り組んだ.\u003cbr /\u003e ここでは,その予備的検討として,新聞の解説記事という文書ジャンルをとりあげ,特定の単一の文書ジャンルを対象とした単一文書要約作成器を作成した.テキスト構造の構成要素として,新聞記事に特徴的に現れる主記,解説,背景,見通し,意見という5つの文タイプを元文書中の文に自動付与し,それらを従来の重要箇所抽出の手法と組み合わせる要約作成手法を提案し,その有効性を調べた.新聞の解説記事のテキスト構造は,特定の話題と意見の繰り返しから構成されることから,本研究では,この構成を考慮し,主記と解説と意見とを組み合わせて要約を作成する戦略を採用した.\u003cbr /\u003e 評価は,元記事の内容をたずねる質問の集合を用意し,要約だけを読んで正しく解答できるかを調べた.その結果,提案手法であるテキスト構造を用いて作成した要約は,従来手法のリード法,および,語の頻度などを手がかりとして重要箇所を抽出する要約作成手法によって作成した要約に比べ,質問への解答率が,10要約の平均で,それぞれ5.8%,8.1%向上した.テキスト構造は要約作成に有望な傾向を確認し,次のBではより複雑な複数文書要約への適用を試みた.\u003cbr /\u003e\u003cbr /\u003eB.文書ジャンルとテキスト構造を用いた複数文書要約:多様な文書ジャンルを対象とした利用者の観点に基づく複数文書要約\u003cbr /\u003e 要約の利用者は,同じ話題に関する要約でも,あることがらや出来事の一連の経緯などの事実が知りたいのか,その出来事に関する識者の意見や書き手の意見を知りたいのかなど,利用者によって重視する情報のタイプが異なる.本研究では,この問題を解決するために,利用者が指定した要約の観点に応じて,複数文書要約を作成するシステムを実現した.\u003cbr /\u003e 要約の観点にはさまざまな捉え方があるが,本研究では,利用者が重視する話題だけではなく,利用者が重視する情報のタイプも区別して,利用者の情報要求により適した要約を作成するために,文書ジャンルとテキスト構造を用いた.文書ジャンルは,詳細描写性,議論性,非個人性,事実性の4つの次元の値の組み合わせで表現するジャンル特性を設定した.テキスト構造の分析は,主記,解説,背景,著者意見,識者意見,見通しの6つの文タイプを使用した.また,提案手法の有用性を検討するために,利用者が重視する情報のタイプを指示して作成した人手作成参照要約を持つ要約実験用データセットViewSumm30を作成し,評価実験を行なった.\u003cbr /\u003e その結果,提案手法は,情報のタイプを考慮しないベースラインシステムよりカバレッジが向上し,その向上率は,事実報告型,意見重視型,知識重視型の要約について,30文書集合の平均で,それぞれ5.4%,33.6%,24.6%であった.また,元文書中の事実,意見,知識を問う質問の集合を作成し,要約を読んだだけで解答できるか調べたところ 提案手法は,ベースラインシステムと比べて,解答率が有意に向上した.これにより,文書ジャンルとテキスト構造を用いることで,従来区別できなかった利用者の情報要求を区別した要約が作成できることがわかった.\u003cbr /\u003e\u003cbr /\u003eC.要約文生成におけるテキスト構造の利用:3段階モデルによるデータからの特定文書ジャンルの要約文生成\u003cbr /\u003e 本研究では,従来の語の出現頻度や出現位置を手がかりとして重要箇所を抽出する要約が一貫性に欠けるという問題を解決するために,要約文作成においてテキスト構造を利用し,時間や場所などの手がかりにより情報を集約してテキストを生成する研究に取り組んだ.AとBの研究が,要約に含める重要箇所の抽出に,入力となる元文書のテキスト構造を利用していたのに対し,この研究では,出力する要約のテキスト構造に着目して情報をわかりやすくまとめて提示するテキスト生成技術を提案した.\u003cbr /\u003e ここでは,数値データなどの抽象的な情報を簡潔にまとめて提示するために,テキスト構造を利用した.また,文書ジャンルの一例としては,天気予報を選択した.テキスト構造の表現にはXMLを用いた.\u003cbr /\u003e 本システムにより自動生成した天気予報と実際の天気予報との一致について評価した結果,場所の表現について何らかのかたちで一致した天気予報が生成できることを確認した.また,テキスト構造を用いることで,大文字と小文字の区別や助動詞の活用などの生成処理を柔軟に実現し,読みやすい要約文生成を実現することができた.\u003cbr /\u003e\u003cbr /\u003e AとCでは,単一の文書の要約を対象としており,文書にどういう種類の情報が現れるかをとらえるためにテキスト構造に着目した.それに対し,Bでは,複数の文書の要約を対象としているため,文書群にどういう種類の情報が現れるかという点について,各文書の文書ジャンルを区別している.ここでは,テキスト構造に加えて,文書ジャンルについても,被験者間の付与の一貫性について調査し,機械学習による自動付与を行なった.\u003cbr /\u003e 本論文を構成する3つの研究では,それぞれ複数の被験者の付与実験またはコーパス文書の分析によってテキスト構造を構成する構成要素が利用者に共通に認識されることを確認し,要約作成への有効性について検証した.その結果,各研究について,テキスト構造を用いることの有効性を示すことができた.", "subitem_description_type": "Other"}]}, "item_1_description_18": {"attribute_name": "フォーマット", "attribute_value_mlt": [{"subitem_description": "application/pdf", "subitem_description_type": "Other"}]}, "item_1_description_7": {"attribute_name": "学位記番号", "attribute_value_mlt": [{"subitem_description": "総研大甲第859号", "subitem_description_type": "Other"}]}, "item_1_select_14": {"attribute_name": "所蔵", "attribute_value_mlt": [{"subitem_select_item": "有"}]}, "item_1_select_8": {"attribute_name": "研究科", "attribute_value_mlt": [{"subitem_select_item": "複合科学研究科"}]}, "item_1_select_9": {"attribute_name": "専攻", "attribute_value_mlt": [{"subitem_select_item": "17 情報学専攻"}]}, "item_1_text_10": {"attribute_name": "学位授与年度", "attribute_value_mlt": [{"subitem_text_value": "2004"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "SEKI, Yohei", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "0", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2016-02-17"}], "displaytype": "simple", "download_preview_message": "", "file_order": 0, "filename": "甲859_要旨.pdf", "filesize": [{"value": "445.7 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_11", "mimetype": "application/pdf", "size": 445700.0, "url": {"label": "要旨・審査要旨", "url": "https://ir.soken.ac.jp/record/837/files/甲859_要旨.pdf"}, "version_id": "17592e0b-9a62-485c-a0df-c6049053f3cb"}, {"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2016-02-17"}], "displaytype": "simple", "download_preview_message": "", "file_order": 1, "filename": "甲859_本文.pdf", "filesize": [{"value": "2.7 MB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_11", "mimetype": "application/pdf", "size": 2700000.0, "url": {"label": "本文", "url": "https://ir.soken.ac.jp/record/837/files/甲859_本文.pdf"}, "version_id": "dab730fb-5bd3-4044-89e7-0590294aa8b8"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "thesis", "resourceuri": "http://purl.org/coar/resource_type/c_46ec"}]}, "item_title": "文書ジャンルとテキスト構造に着目した自動要約", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "文書ジャンルとテキスト構造に着目した自動要約"}, {"subitem_title": "AUTOMATIC SUMMARIZATION FOCUSING ON DOCUMENT GENRE AND TEXT STRUCTURE", "subitem_title_language": "en"}]}, "item_type_id": "1", "owner": "1", "path": ["19"], "permalink_uri": "https://ir.soken.ac.jp/records/837", "pubdate": {"attribute_name": "公開日", "attribute_value": "2010-02-22"}, "publish_date": "2010-02-22", "publish_status": "0", "recid": "837", "relation": {}, "relation_version_is_last": true, "title": ["文書ジャンルとテキスト構造に着目した自動要約"], "weko_shared_id": -1}
文書ジャンルとテキスト構造に着目した自動要約
https://ir.soken.ac.jp/records/837
https://ir.soken.ac.jp/records/8376557d172-8ef0-4bc5-916e-662dcc6a5440
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
||
![]() |
Item type | 学位論文 / Thesis or Dissertation(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2010-02-22 | |||||
タイトル | ||||||
タイトル | 文書ジャンルとテキスト構造に着目した自動要約 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | AUTOMATIC SUMMARIZATION FOCUSING ON DOCUMENT GENRE AND TEXT STRUCTURE | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_46ec | |||||
資源タイプ | thesis | |||||
著者名 |
関, 洋平
× 関, 洋平 |
|||||
フリガナ |
セキ, ヨウヘイ
× セキ, ヨウヘイ |
|||||
著者 |
SEKI, Yohei
× SEKI, Yohei |
|||||
学位授与機関 | ||||||
学位授与機関名 | 総合研究大学院大学 | |||||
学位名 | ||||||
学位名 | 博士(情報学) | |||||
学位記番号 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 総研大甲第859号 | |||||
研究科 | ||||||
値 | 複合科学研究科 | |||||
専攻 | ||||||
値 | 17 情報学専攻 | |||||
学位授与年月日 | ||||||
学位授与年月日 | 2005-03-24 | |||||
学位授与年度 | ||||||
2004 | ||||||
要旨 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 本論文では,文書ジャンルとテキスト構造を用いた自動要約の新たな手法を提案し,その有効性を検証した.文書ジャンルとは,日記や報告書のような文書の種類を意味する.また,テキスト構造は,テキスト全体に対する各文の果たしている役割や機能を構成要素として捉えてテキストの構成を説明する機能構造に着目した.このような構造は,その文書ジャンルのテキストに含まれる典型的な構成要素,テキストにおける構成要素の一般的な出現順序,構成要素間の関係などによって決まる.本研究では,この文書ジャンルとテキスト構造を要約作成のための元文書からの重要箇所抽出と要約文生成に用いた.<br /> 従来の自動要約研究では,主として文書中での内容語の出現頻度等を手がかりとして文書の話題に着目した要約作成を目指してきた.これらの研究は,作成された要約が内容のバランスと文章としての一貫性に欠け,また,ある話題について,たとえば事実を知りたいのか,意見を知りたいのかといった利用者が重視する情報のタイプの違いなどを扱うことはできず,利用者の情報要求における話題以外の側面に柔軟に応じることが難しいという問題があった.<br /> それに対し,本論文は,文書の話題だけではなく,情報のタイプ(例えば,意見か,事実報告かなど)をも区別した要約作成という新しい課題を提起し,内容語の出現頻度とともに,文書ジャンルとテキスト構造に着目した新たな手法を提案した.そして,実験によって,提案手法が,利用者の重視する話題と情報のタイプ(例えば,意見を知りたいのか,事実を知りたいのかなど)に応じた要約作成,元文書からのバランスよい内容抽出,要約文の一貫性の向上において有効であることを示した.具体的には,以下の3点について研究を行なった.<br /> A)元文書からバランスよく内容を抽出した要約の作成<br /> B)どういう種類の情報を知りたいか(意見を知りたいのか,事実を知りたいのか,知識を知りたいのか)を区別した要約作成<br /> C)書き手や読み手にとって自然な構成をもった要約文の生成<br /> 本論文を構成する研究テーマとして,以下の3つを取り上げた.<br /><br />A.テキスト構造を用いた単一文書要約:解説記事の携帯電話向け要約を例として<br /> 研究Aと研究Bでは,元文書における語の出現頻度とともに,文書ジャンルとテキスト構造を用いて要約に含める重要箇所を抽出する自動要約手法について取り組んだ.<br /> ここでは,その予備的検討として,新聞の解説記事という文書ジャンルをとりあげ,特定の単一の文書ジャンルを対象とした単一文書要約作成器を作成した.テキスト構造の構成要素として,新聞記事に特徴的に現れる主記,解説,背景,見通し,意見という5つの文タイプを元文書中の文に自動付与し,それらを従来の重要箇所抽出の手法と組み合わせる要約作成手法を提案し,その有効性を調べた.新聞の解説記事のテキスト構造は,特定の話題と意見の繰り返しから構成されることから,本研究では,この構成を考慮し,主記と解説と意見とを組み合わせて要約を作成する戦略を採用した.<br /> 評価は,元記事の内容をたずねる質問の集合を用意し,要約だけを読んで正しく解答できるかを調べた.その結果,提案手法であるテキスト構造を用いて作成した要約は,従来手法のリード法,および,語の頻度などを手がかりとして重要箇所を抽出する要約作成手法によって作成した要約に比べ,質問への解答率が,10要約の平均で,それぞれ5.8%,8.1%向上した.テキスト構造は要約作成に有望な傾向を確認し,次のBではより複雑な複数文書要約への適用を試みた.<br /><br />B.文書ジャンルとテキスト構造を用いた複数文書要約:多様な文書ジャンルを対象とした利用者の観点に基づく複数文書要約<br /> 要約の利用者は,同じ話題に関する要約でも,あることがらや出来事の一連の経緯などの事実が知りたいのか,その出来事に関する識者の意見や書き手の意見を知りたいのかなど,利用者によって重視する情報のタイプが異なる.本研究では,この問題を解決するために,利用者が指定した要約の観点に応じて,複数文書要約を作成するシステムを実現した.<br /> 要約の観点にはさまざまな捉え方があるが,本研究では,利用者が重視する話題だけではなく,利用者が重視する情報のタイプも区別して,利用者の情報要求により適した要約を作成するために,文書ジャンルとテキスト構造を用いた.文書ジャンルは,詳細描写性,議論性,非個人性,事実性の4つの次元の値の組み合わせで表現するジャンル特性を設定した.テキスト構造の分析は,主記,解説,背景,著者意見,識者意見,見通しの6つの文タイプを使用した.また,提案手法の有用性を検討するために,利用者が重視する情報のタイプを指示して作成した人手作成参照要約を持つ要約実験用データセットViewSumm30を作成し,評価実験を行なった.<br /> その結果,提案手法は,情報のタイプを考慮しないベースラインシステムよりカバレッジが向上し,その向上率は,事実報告型,意見重視型,知識重視型の要約について,30文書集合の平均で,それぞれ5.4%,33.6%,24.6%であった.また,元文書中の事実,意見,知識を問う質問の集合を作成し,要約を読んだだけで解答できるか調べたところ 提案手法は,ベースラインシステムと比べて,解答率が有意に向上した.これにより,文書ジャンルとテキスト構造を用いることで,従来区別できなかった利用者の情報要求を区別した要約が作成できることがわかった.<br /><br />C.要約文生成におけるテキスト構造の利用:3段階モデルによるデータからの特定文書ジャンルの要約文生成<br /> 本研究では,従来の語の出現頻度や出現位置を手がかりとして重要箇所を抽出する要約が一貫性に欠けるという問題を解決するために,要約文作成においてテキスト構造を利用し,時間や場所などの手がかりにより情報を集約してテキストを生成する研究に取り組んだ.AとBの研究が,要約に含める重要箇所の抽出に,入力となる元文書のテキスト構造を利用していたのに対し,この研究では,出力する要約のテキスト構造に着目して情報をわかりやすくまとめて提示するテキスト生成技術を提案した.<br /> ここでは,数値データなどの抽象的な情報を簡潔にまとめて提示するために,テキスト構造を利用した.また,文書ジャンルの一例としては,天気予報を選択した.テキスト構造の表現にはXMLを用いた.<br /> 本システムにより自動生成した天気予報と実際の天気予報との一致について評価した結果,場所の表現について何らかのかたちで一致した天気予報が生成できることを確認した.また,テキスト構造を用いることで,大文字と小文字の区別や助動詞の活用などの生成処理を柔軟に実現し,読みやすい要約文生成を実現することができた.<br /><br /> AとCでは,単一の文書の要約を対象としており,文書にどういう種類の情報が現れるかをとらえるためにテキスト構造に着目した.それに対し,Bでは,複数の文書の要約を対象としているため,文書群にどういう種類の情報が現れるかという点について,各文書の文書ジャンルを区別している.ここでは,テキスト構造に加えて,文書ジャンルについても,被験者間の付与の一貫性について調査し,機械学習による自動付与を行なった.<br /> 本論文を構成する3つの研究では,それぞれ複数の被験者の付与実験またはコーパス文書の分析によってテキスト構造を構成する構成要素が利用者に共通に認識されることを確認し,要約作成への有効性について検証した.その結果,各研究について,テキスト構造を用いることの有効性を示すことができた. | |||||
所蔵 | ||||||
値 | 有 | |||||
フォーマット | ||||||
内容記述タイプ | Other | |||||
内容記述 | application/pdf |