段階的一般化法によるミスマッチクラスタを表現する最小汎化集合の効率的抽出

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/7007
ファイル
タイトル
段階的一般化法によるミスマッチクラスタを表現する最小汎化集合の効率的抽出
別タイトル
An Efficient Method for Extracting Minimum Generalized Set of Mismatch Clusters by Step-Wise Generalization
著者
氏名 田村 慶一
ヨミ タムラ ケイイチ
別名 TAMURA Keiichi
氏名 木村 浩明
ヨミ キムラ ヒロアキ
別名 KIMURA Hiroaki
氏名 荒木 康太郎
ヨミ アラキ コウタロウ
別名 ARAKI Kotaro
氏名 北上 始
ヨミ キタカミ ハジメ
別名 KITAKAMI Hajime
キーワード
テキストマイニング
情報抽出
バイオインフォマティクス
抄録

配列データベースに対するあいまいな問合せ結果として返されるミスマッチクラスタから,あいまい文字表現を含む最小汎化集合を効率的に抽出する方法を提案する.この提案手法は,ミスマッチクラスタの部分集合のすべてについて,小さなサイズの部分集合から順に列挙し,列挙木を探索するボトムアップアプローチをとっている.この探索過程において,列挙された各集合に対する最汎パターンの計算,不要な部分列挙木の枝刈り,冗長なパターンの除去などを実施することにより,ミスマッチクラスタの最小汎化集合を抽出する.提案手法の有効性を確認するために,10種類のデータセットを用いて実験を行ったので,その実験結果についても報告する.

査読の有無
掲載雑誌名
電子情報通信学会論文誌. D, 情報・システム
J93-D
3
開始ページ
189
終了ページ
202
出版年月日
2010-03-01
出版者
社団法人電子情報通信学会
ISSN
1880-4535
NCID
AA12099634
NAID
110007588755
本文言語
日本語
資料タイプ
学術雑誌論文
著者版フラグ
出版社版
権利情報
copyright©2010 IEICE
関連URL
旧URI
区分
hiroshima-cu