@misc{oai:ir.soken.ac.jp:00000869, author = {松岡, 有希 and マツオカ, ユウキ and MATSUOKA, Yuki}, month = {2016-02-17, 2016-02-17}, note = {近年のWWWでは, ユーザ参加型のサービスが多く提供されており, 多種多様な情報が
大量に存在する. 大量の情報は, 反面ユーザがほしい情報を探すときの妨げになっている
場合がある. これを解決する一つの方法として, Webコンテンツにメタデータを付加する
ことが挙げられる. メタデータは "data about data" と定義され, 情報の管理, 統合,
検索などの用途で使用されてきた. 本研究では, メタデータを情報検索の目的で使用する
ために, Webコンテンツの内容を代表する意味的メタデータを生成することを目標とする.
 意味的メタデータには, Webコンテンツの主題を表す語や特徴語, コンテンツの内容と
関連する語が記述されることが望ましい. 意味的なメタデータを生成の二つの課題(1)
誰がメタデータを生成するのか, (2)どのようにメタデータを生成するのか, を次のアプ
ローチで解決を図る. (1)Webコンテンツの著者がメタデータを生成する場合, 著者の意
図が反映されてしまい, 読者にとって有益な情報が提供されるとは限らない. そこで本研
究では, Webコンテンツの複数の読者によってメタデータを生成することを提案する. 複
数ユーザによる集合知を活用することで, 質の高いメタデータの生成が期待できる. (2)
Webコンテンツの読者が負担を感じることなく, メタデータを作成してもらえるようなア
ーキテクチャが必要である. そこで本研究では, メタデータ生成のためにアノテーション
を用いることを提案する. ユーザが読書をする際の自然な行為をメタデータ生成に用いる
ことにより, ユーザのメタデータ生成における負担を軽減することが期待できる.
 なお, 本稿では人工知能学会全国大会で運用された大会支援システムの一機能として提
供したアノテーションシステムの実装・運用によって得られたデータを基に分析を行った.
 まず初めに, ユーザがWebコンテンツ内で下線を付与した箇所にはどのような特徴が
あるのかについて調査した. イロノミーは, 三色ボールペン読書法に基づいて下線を付与
できるシステムである. 分析の結果, 全ユーザで見ると, 色にかかわらずtfidf値の高い
語, すなわち特徴語に下線が付与される可能性が高いということがわかった. また, 下線
が付与された語はWebコンテンツの内容を直接反映した語と判断でき, 主題を表す語が
含まれることから, 複数ユーザによって付与された下線文を集約すると, 意味的メタデー
タの生成に利用できる語が含まれることが見出された.
 次に, ユーザがマーキングを付与した語や文字列を他人と共有した場合, 情報探索に役
立つのかについて調べた. ページ間類似度やマーキングされた文字列内(マーキング文字
列)の語を使ったページ推薦を行う合口を運用することにより, 分析を行った. その結果,
ユーザは学会中において, ページ間類似度によるページ推薦よりも, 他のページに付与さ
れているマーキング文字列内の語を使ったページ推薦を選択することが示唆された.
 最後に, ユーザが発表を聴講している際に書いたメモと論文内容との関係性について調
査した. ユーザが発表聴講時に2種類のメモ(個人メモ,質問メモ)を書くことができる
システム, memoQを運用した. ユーザはmemoQを利用して, 分析の結果, ユーザがメ
モを入力するときのコンテキストを利用することによって, メモからコンテンツ内の特徴
語やコンテンツに含まれないが内容と関連のある語が獲得できる可能性が見出された.
 これらの分析結果より, 複数ユーザが付与したアノテーションから意味的メタデータに
有用な語を獲得できる可能性があることが分かった.
, application/pdf, 総研大甲第1154号}, title = {意味的メタデータ生成のための協調型アノテーションに関する研究}, year = {} }