Extending the Peak Bandwidth of Parameters for Softmax Selection in Reinforcement Learning
URI | http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/12387 | ||||||
---|---|---|---|---|---|---|---|
ファイル |
tnnls-2015-p-5568.r1.pdf
( 389.0 KB )
公開日
:2017-10-10
|
||||||
タイトル |
Extending the Peak Bandwidth of Parameters for Softmax Selection in Reinforcement Learning
|
||||||
著者 |
|
||||||
キーワード |
Asymptotic equipartition property (AEP)
parameter bandwidth
reinforcement learning (RL)
softmax selection
|
||||||
抄録 |
Softmax selection is one of the most popular |
||||||
査読の有無 |
有
|
||||||
掲載雑誌名 |
IEEE Transactions on Neural Networks and Learning Systems
|
||||||
巻 |
28
|
||||||
号 |
8
|
||||||
開始ページ |
1865
|
||||||
終了ページ |
1877
|
||||||
出版年月日 |
2016-05-11
|
||||||
出版者 |
IEEE
|
||||||
ISSN |
2162237X
|
||||||
NCID |
AA1255553X
|
||||||
DOI |
10.1109/TNNLS.2016.2558295
|
||||||
PubMed ID |
27187974
|
||||||
本文言語 |
英語
|
||||||
資料タイプ |
学術雑誌論文
|
||||||
著者版フラグ |
著者版
|
||||||
権利情報 |
© 2016 IEEE. Personal use is permitted, but republication/redistribution requires IEEE permission.See http://www.ieee.org/publications_standards/publications/rights/index.html for more information.
This manuscript version is made available under the CC-BY-NC-ND 4.0 license http://creativecommons.org/licenses/by-nc-nd/4.0/
|
||||||
関連URL | |||||||
区分 |
hiroshima-cu
|