画像変換手法による音声強調のためのスペクトログラム変換

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/12577
ファイル
タイトル
画像変換手法による音声強調のためのスペクトログラム変換
別タイトル
Spectrogram Transforms for Speech Enhancement by Image-to-image Translation
ガゾウ ヘンカン シュホウ ニヨル オンセイ キョウチョウ ノ タメノ スペクトログラム ヘンカン
著者
氏名 黒澤 義明
ヨミ クロサワ ヨシアキ
別名 KUROSAWA Yoshiaki
氏名 目良 和也
ヨミ メラ カズヤ
別名 MERA Kazuya
氏名 竹澤 寿幸
ヨミ タケザワ トシユキ
別名 TAKEZAWA Toshiyuki
抄録

We aimed to examine well-known image-to-image translation technique, so-called pix2pix based on deep neural networks. Focusing on time-frequency analysis and implementing auxiliary classifier generative adversarial networks (ACGAN), we estimated the transform performance of spectrograms for sound enhancement. As a result using an image index, SSIM, we confirmed to slightly improve its performance compared to the original research.

内容記述

2020年度(第34回) : 2020年6月9日-6月12日 : オンライン

掲載雑誌名
人工知能学会全国大会論文集
34
開始ページ
1
終了ページ
4
出版年月日
2020
出版者
人工知能学会
NCID
AA11578981
DOI
本文言語
日本語
資料タイプ
会議発表論文
著者版フラグ
出版社版
権利情報
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。
関連URL
備考

3Rin4-59
本研究の一部は国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」グラント番号JPMJCE1311の支援によって行われている。また、広島市立大学特定研究費(先端学術研究費H27~29,30年度科研費獲得支援費)の支援を得ている。

区分
hiroshima-cu