ブログユーザ空間からの重複を許した頻出コミュニティ抽出法

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/6879
ファイル
タイトル
ブログユーザ空間からの重複を許した頻出コミュニティ抽出法
別タイトル
Extraction Method of Overlapping Frequent Communities from Blog User Spaces
著者
氏名 高木 允
ヨミ タカキ マコト
別名 TAKAKI Makoto
氏名 森 康真
ヨミ モリ ヤスマ
別名 MORI Yasuma
氏名 田村 慶一
ヨミ タムラ ケイイチ
別名 TAMURA Keiichi
氏名 北上 始
ヨミ キタカミ ハジメ
別名 KITAKAMI Hajime
抄録

本研究では,ブログの書き手であるブロガに焦点を当て,ブロガをノード,トラックバックによるつながりを辺としたグラフから,数カ月にわたって頻出し,かつ重複を許したコミュニティを発見する手法を提案する.提案手法は,複数のグラフから頻出部分グラフを抽出し,得られた頻出部分グラフに重複を許したクラスタリング手法を適用することにより,重複を許した頻出コミュニティを発見する.頻出部分グラフの抽出については,頻出部分グラフ抽出の問題を頻出アイテム集合抽出の問題に変換し,LCM法を用いることで頻出部分グラフ抽出を達成している.重複を許したクラスタリングについては,頻出部分グラフをNewmanらのクラスタリング手法を応用し,縮約グラフの作成と再クラスタリングすることで達成している.提案手法の有用性を確認するために,複数カ月にわたりブログデータを収集し,頻出コミュニティの抽出を行った.その結果,共通の興味・関心を持って頻出するコミュニティと,複数のコミュニティに重複してクラスタリングされるブロガを発見できた. / In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step, we applied the Newman's algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities. As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.

査読の有無
掲載雑誌名
情報処理学会論文誌. 数理モデル化と応用
49
SIG_4(TOM_20)
開始ページ
93
終了ページ
104
出版年月日
2008-03-15
出版者
社団法人情報処理学会
ISSN
0387-5806
NCID
AA11464803
NAID
110006684621
本文言語
日本語
資料タイプ
学術雑誌論文
著者版フラグ
出版社版
権利情報
本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 / The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
本文データは学協会の許諾に基づきCiNiiから複製したものである
関連情報
isVersionOf:http://ci.nii.ac.jp/naid/110006684621
関連URL
旧URI
区分
hiroshima-cu