極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/1430
ファイル
タイトル
極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出
別タイトル
Extraction of Non-redundant Frequent Sequence Patterns with Minimum Cover on Variable-Length Wildcard Regions
著者
氏名 加藤 智之
ヨミ カトウ トモユキ
別名 KATO Tomoyuki
氏名 北上 始
ヨミ キタカミ ハジメ
別名 KITAKAMI Hajime
氏名 森 康真
ヨミ モリ ヤスマ
別名 MORI Yasuma
氏名 田村 慶一
ヨミ タムラ ケイイチ
別名 TAMURA Keiichi
氏名 黒木 進
ヨミ クロキ ススム
別名 KUROKI Susumu
キーワード
配列パターン抽出
可変長ワイルドカード領域
オカーレンス
スコープデータベース
抄録

筆者らは,分子配列データベースから生物学的に重要な機能をもつ特徴的なパターンであるモチーフの候補である頻出パターンを抽出するために,極小な可変長ワイルドカード領域をもつ頻出パターンを導き出す方法を提案する.この方法は,k-頻出パターン(長さkの頻出パターン)から(k+1)-頻出パターンを生成するパターン成長アプローチを拡張し,k-頻出パターンごとにスコープデータベースを作成する.k-頻出パターンのスコープデータベースは,従来の射影データベースに含まれるスキャン開始位置の情報に、ユーザにより定められた参照範囲の情報とそれまでに求まった可変長のk-頻出パターンに対するすべてのオカーレンスの情報を加えている.これにより,抽出される可変長の(k+1)-頻出パターンの可変長ワイルドカード領域が非極小,または冗長になることを回避することができる.スコープデータベースの有効性を示すため,PROSITEからLeucine Zipper モチーフ及びZinc Finger モチーフを含むデータセットをそれぞれ取り出し,各データセットに対して可変長の頻出パターンを抽出する能力の評価を行ったので,その結果を報告する.

査読の有無
掲載雑誌名
電子情報通信学会論文誌. D, 情報・システム
J90-D
2
開始ページ
281
終了ページ
291
出版年月日
2007-02
出版者
電子情報通信学会
ISSN
18804535
本文言語
日本語
資料タイプ
学術雑誌論文
著者版フラグ
出版社版
権利情報
copyright©2007 IEICE
関連URL
旧URI
区分
hiroshima-cu