ブログユーザ空間からの重複を許した頻出コミュニティ抽出法

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/6879
File
Title
ブログユーザ空間からの重複を許した頻出コミュニティ抽出法
Title Alternative
Extraction Method of Overlapping Frequent Communities from Blog User Spaces
Author
氏名 高木 允
ヨミ タカキ マコト
別名 TAKAKI Makoto
氏名 森 康真
ヨミ モリ ヤスマ
別名 MORI Yasuma
氏名 田村 慶一
ヨミ タムラ ケイイチ
別名 TAMURA Keiichi
氏名 北上 始
ヨミ キタカミ ハジメ
別名 KITAKAMI Hajime
Abstract

本研究では,ブログの書き手であるブロガに焦点を当て,ブロガをノード,トラックバックによるつながりを辺としたグラフから,数カ月にわたって頻出し,かつ重複を許したコミュニティを発見する手法を提案する.提案手法は,複数のグラフから頻出部分グラフを抽出し,得られた頻出部分グラフに重複を許したクラスタリング手法を適用することにより,重複を許した頻出コミュニティを発見する.頻出部分グラフの抽出については,頻出部分グラフ抽出の問題を頻出アイテム集合抽出の問題に変換し,LCM法を用いることで頻出部分グラフ抽出を達成している.重複を許したクラスタリングについては,頻出部分グラフをNewmanらのクラスタリング手法を応用し,縮約グラフの作成と再クラスタリングすることで達成している.提案手法の有用性を確認するために,複数カ月にわたりブログデータを収集し,頻出コミュニティの抽出を行った.その結果,共通の興味・関心を持って頻出するコミュニティと,複数のコミュニティに重複してクラスタリングされるブロガを発見できた. / In this study, we focus on bloggers who are writers of blog articles and propose a technique which extracts frequent and overlapped communities across multiple months from graphs consisting of nodes and edges. A node is defined as a blogger and an edge is a connection of trackback. First, the proposed technique extracts frequent communities by extracting frequent subgraphs. Second, the proposed technique extracts overlapping communities by clustering the extracted subgraphs. In the procedures of extraction of frequent subgraphs, we transform the frequent subgraphs extraction problem to the frequent itemsets extraction problem. In the first step, the LCM algorithm is applied to extract the frequent itemsets. In the second step, we applied the Newman's algorithm to find overlapping clusters. To confirm the availability of proposed technique, we collected the graph data and extracted the frequent communities. As a result, frequent communities which have common interests and the bloggers who are clustered into multiple clusters are extracted.

Description Peer Reviewed
Journal Title
情報処理学会論文誌. 数理モデル化と応用
Volume
49
Issue
SIG_4(TOM_20)
Spage
93
Epage
104
Published Date
2008-03-15
Publisher
社団法人情報処理学会
ISSN
0387-5806
NCID
AA11464803
NAID
110006684621
Language
jpn
NIIType
Journal Article
Text Version
出版社版
Rights
本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 / The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan.
本文データは学協会の許諾に基づきCiNiiから複製したものである
Relation
isVersionOf:http://ci.nii.ac.jp/naid/110006684621
Relation URL
Old URI
Set
hiroshima-cu