PCクラスタを用いたProfit Sharingの並列化手法

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/1397
File
Title
PCクラスタを用いたProfit Sharingの並列化手法
Author
氏名 串田 正幸
ヨミ クシダ マサユキ
別名 KUSHIDA Masayuki
氏名 高橋 健一
ヨミ タカハシ ケンイチ
別名 TAKAHASHI Kenichi
氏名 上田 祐彰
ヨミ ウエダ ヒロアキ
別名 UEDA Hiroaki
氏名 宮原 哲浩
ヨミ ミヤハラ テツヒロ
別名 MIYAHARA Tetsuhiro
Subject
強化学習
Profit Sharing
並列モデル
Abstract

強化学習は試行錯誤を通じて環境に適応していく学習制御の枠組みである.しかし,強化学習は知識のない状態から試行錯誤により学習を行うため学習に時間がかかる.つまり,膨大な量の計算を要する.また,近年,高性能で安価なパーソナルコンピュータPCを手に入れることができるようになっている.そこで,膨大な計算量を必要とする処理を高速に実行するための方法の一つとして,複数のPCを用いて計算量を分割し,並列に処理させる強化学習の並列化が提案されている.本研究では,強化学習の代表的な手法のひとつであるProfit Sharingを用いた並列型強化学習手法を提案し,逐次型Profit Sharingとの性能比較を行う.

Journal Title
電気・情報関連学会中国支部連合大会講演論文集
Issue
58
Spage
240
Epage
241
Published Date
2007-10
Publisher
電気・情報関連学会中国支部
Language
jpn
NIIType
Conference Paper
Text Version
出版社版
Relation URL
Old URI
Set
hiroshima-cu