論文データベースからのイディオム用例検索

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/5944
ファイル
タイトル
論文データベースからのイディオム用例検索
別タイトル
Searching Example Sentences of Idioms in a Research Paper Database
著者
氏名 難波 英嗣
ヨミ ナンバ ヒデツグ
別名 NANBA Hidetsugu
氏名 森下 智史
ヨミ モリシタ サトシ
別名 MORISHITA Satoshi
氏名 相沢 輝昭
ヨミ アイザワ テルアキ
別名 AIZAWA Teruaki
キーワード
イディオム
論文
用例検索
構文解析
抄録

英語イディオムの用例を学術論文データベースから自動収集する手法を提案する.本研究では, 特に, "regard〜as"のように, 構成語が文中で不連続なイディオム(分離型イディオム)を対象にする.従来は, 分離個所に含まれる単語数を制限して分離型イディオムの検索を行っていた.しかし, この方法では, 分離個所に節を含むような用例を検索することができなかった.そこで本研究では, 階層距離という尺度を定義し, 構文レベルでの構成語の距離を測る手法を提案した.実験の結果, 精度0.862, 再現率0.726が得られ, 提案手法の有効性が確認された. / In this paper, we propose a method to search example sentences of English idioms from a research paper database. We focus on decomposable idioms such as "regard-as." Traditionally, the decomposable idioms have been searched by limiting the maximum number of words between idiom particles. However, this method could not collect example sentences, in which clauses are inserted between idiom particles. We therefore devise a measure that calculates the distance between idiom particles on a parse tree, and use it for decomposable idiom search. We conducted an examination, and obtained the precision of 0.862 and the recall of 0.726.

掲載雑誌名
情報処理学会研究報告. 自然言語処理研究会報告
2005
117
開始ページ
53
終了ページ
59
出版年月日
2005-11-21
出版者
社団法人情報処理学会
ISSN
0919-6072
NCID
AN10115061
NAID
110002973358
本文言語
日本語
資料タイプ
テクニカルレポート
著者版フラグ
出版社版
権利情報
本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 /The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
関連URL
旧URI
区分
hiroshima-cu