旅行ブログエントリからの観光情報の自動抽出

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/9558
ファイル
タイトル
旅行ブログエントリからの観光情報の自動抽出
別タイトル
Automatic Compilation of Travel Information from Automatically Identified Travel Blog Entries
著者
氏名 石野 亜耶
ヨミ イシノ アヤ
別名 ISHINO Aya
氏名 難波 英嗣
ヨミ ナンバ ヒデツグ
別名 NANBA Hidetsugu
氏名 竹澤 寿幸
ヨミ タケザワ トシユキ
別名 TAKEZAWA Toshiyuki
キーワード
Blog
Information Extraction
Travel Information
抄録

本研究では,自動的に観光情報を収集するための手法を提案する.我々は観光情報を収集するため,ブロガーが日記形式で綴った旅行記である旅行ブログエントリに焦点を当てた.多くのブロガーが旅行記をこの形で記述するため,旅行ブログエントリは観光情報を得るための有益な情報源であると考えられる.まず本研究では,ブログデータベースから旅行ブログエントリを検出した.その中から観光情報として土産物情報と観光名所情報を抽出する手法を提案した.更に,旅行ブログエントリからリンクを抽出することで,観光情報リンク集の構築を行った.また実験により提案手法の有効性を示した.旅行ブログエントリの検出に関しては,再現率 38.1%,精度 86.7%を得た.また,旅行ブログエントリからの観光情報の抽出においては,抽出された上位 100 件の土産物において精度 74.0%,観光名所において精度 71.0%を得ることができたため,旅行ブログエントリは観光情報の有益な情報源であるといえる.旅行ブログエントリからの観光情報リンク集の自動構築においても,高い精度・再現率を得られており,提案手法の有効性を示すことができたと言える. / In this paper, we propose a method for compiling travel information automatically. For the compilation, we focus on travel blog entries, which are defined as travel journals written by bloggers in diary form. We consider that travel blog entries are a useful information source for obtaining travel information, because many bloggers travel experiences are written in this form. First, we identified travel blog entries in a blog database. Next, we extracted souvenir information and tourist spots information as travel information from them. Furthermore, we extracted hyperlinks from travel blog entries and constructed the collection of travel information links. We have confirmed the effectiveness of our method by experiment. For the identification of travel blog entries, we obtained scores of 38.1% for Recall and 86.7% for Precision. In the extraction of travel information from travel blog entries, we obtained 74.0% and 71.0% for Precisions at the top 100 extracted local products and tourist spots, respectively, and thereby confirming that travel blog entries are a useful source of travel information. In the construction of the collection of travel information links, we obtained high precision and recall.

掲載雑誌名
知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics
22
6
開始ページ
667
終了ページ
679
出版年月日
2010-12-15
出版者
日本知能情報ファジィ学会
ISSN
1347-7986
NCID
AA1181479X
DOI
10.3156/jsoft.22.667
NAID
10027129891
本文言語
日本語
資料タイプ
学術雑誌論文
著者版フラグ
出版社版
権利情報
Copyright (c) 2010 日本知能情報ファジィ学会
関連URL
旧URI
区分
hiroshima-cu