PCクラスタを用いたProfit Sharingの並列化手法

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/1397
ファイル
タイトル
PCクラスタを用いたProfit Sharingの並列化手法
著者
氏名 串田 正幸
ヨミ クシダ マサユキ
別名 KUSHIDA Masayuki
氏名 高橋 健一
ヨミ タカハシ ケンイチ
別名 TAKAHASHI Kenichi
氏名 上田 祐彰
ヨミ ウエダ ヒロアキ
別名 UEDA Hiroaki
氏名 宮原 哲浩
ヨミ ミヤハラ テツヒロ
別名 MIYAHARA Tetsuhiro
キーワード
強化学習
Profit Sharing
並列モデル
抄録

強化学習は試行錯誤を通じて環境に適応していく学習制御の枠組みである.しかし,強化学習は知識のない状態から試行錯誤により学習を行うため学習に時間がかかる.つまり,膨大な量の計算を要する.また,近年,高性能で安価なパーソナルコンピュータPCを手に入れることができるようになっている.そこで,膨大な計算量を必要とする処理を高速に実行するための方法の一つとして,複数のPCを用いて計算量を分割し,並列に処理させる強化学習の並列化が提案されている.本研究では,強化学習の代表的な手法のひとつであるProfit Sharingを用いた並列型強化学習手法を提案し,逐次型Profit Sharingとの性能比較を行う.

掲載雑誌名
電気・情報関連学会中国支部連合大会講演論文集
58
開始ページ
240
終了ページ
241
出版年月日
2007-10
出版者
電気・情報関連学会中国支部
本文言語
日本語
資料タイプ
会議発表論文
著者版フラグ
出版社版
関連URL
旧URI
区分
hiroshima-cu