極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/1430
File
Title
極小かつ非冗長な可変長ワイルドカード領域をもつ頻出パターンの抽出
Title Alternative
Extraction of Non-redundant Frequent Sequence Patterns with Minimum Cover on Variable-Length Wildcard Regions
Author
氏名 加藤 智之
ヨミ カトウ トモユキ
別名 KATO Tomoyuki
氏名 北上 始
ヨミ キタカミ ハジメ
別名 KITAKAMI Hajime
氏名 森 康真
ヨミ モリ ヤスマ
別名 MORI Yasuma
氏名 田村 慶一
ヨミ タムラ ケイイチ
別名 TAMURA Keiichi
氏名 黒木 進
ヨミ クロキ ススム
別名 KUROKI Susumu
Subject
配列パターン抽出
可変長ワイルドカード領域
オカーレンス
スコープデータベース
Abstract

筆者らは,分子配列データベースから生物学的に重要な機能をもつ特徴的なパターンであるモチーフの候補である頻出パターンを抽出するために,極小な可変長ワイルドカード領域をもつ頻出パターンを導き出す方法を提案する.この方法は,k-頻出パターン(長さkの頻出パターン)から(k+1)-頻出パターンを生成するパターン成長アプローチを拡張し,k-頻出パターンごとにスコープデータベースを作成する.k-頻出パターンのスコープデータベースは,従来の射影データベースに含まれるスキャン開始位置の情報に、ユーザにより定められた参照範囲の情報とそれまでに求まった可変長のk-頻出パターンに対するすべてのオカーレンスの情報を加えている.これにより,抽出される可変長の(k+1)-頻出パターンの可変長ワイルドカード領域が非極小,または冗長になることを回避することができる.スコープデータベースの有効性を示すため,PROSITEからLeucine Zipper モチーフ及びZinc Finger モチーフを含むデータセットをそれぞれ取り出し,各データセットに対して可変長の頻出パターンを抽出する能力の評価を行ったので,その結果を報告する.

Description Peer Reviewed
Journal Title
電子情報通信学会論文誌. D, 情報・システム
Volume
J90-D
Issue
2
Spage
281
Epage
291
Published Date
2007-02
Publisher
電子情報通信学会
ISSN
18804535
Language
jpn
NIIType
Journal Article
Text Version
出版社版
Rights
copyright©2007 IEICE
Relation URL
Old URI
Set
hiroshima-cu