機械学習による科学技術論文からの書誌情報の自動抽出

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/5948
ファイル
タイトル
機械学習による科学技術論文からの書誌情報の自動抽出
別タイトル
Automatic extraction of bibliography with machine learning
著者
氏名 阿辺川 武
ヨミ アベカワ タケシ
別名 ABEKAWA Takeshi
氏名 難波 英嗣
ヨミ ナンバ ヒデツグ
別名 NANBA Hidetsugu
氏名 高村 大也
ヨミ タカムラ ヒロヤ
別名 TAKAMURA Hiroya
氏名 奥村 学
ヨミ オクムラ マナブ
別名 OKUMURA Manabu
抄録

本論文では,電子化された学術論文から,その論文ファイルの書誌情報および参考文献の書誌情報を抽出する手法を提案する.両書誌情報の抽出ともにサポートベクトルマシンによる機械学習手法を使用し,論文ファイルの書誌情報には,視覚的素性と言語的素性を用いることで,また参考文献の書誌情報抽出には各フィールドの出現順を制約に組み入れることで高精度で抽出が出来るようになった. / In this paper, we propose an extraction method of bibliography using support vector machines. We use visual and linguistic features for extracting bibliography of a paper, and use field order for extracting reference information. Our method leads to high precision extraction.

掲載雑誌名
情報処理学会研究報告. 情報学基礎研究会報告
2003
98
開始ページ
83
終了ページ
90
出版年月日
2003-09-29
出版者
社団法人情報処理学会
ISSN
0919-6072
NCID
AN10114171
NAID
110002948749
本文言語
日本語
資料タイプ
テクニカルレポート
著者版フラグ
出版社版
権利情報
本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 /The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
関連URL
旧URI
区分
hiroshima-cu