画像変換手法による音声強調のためのスペクトログラム変換

URI http://harp.lib.hiroshima-u.ac.jp/hiroshima-cu/metadata/12577
File
Title
画像変換手法による音声強調のためのスペクトログラム変換
Title Alternative
Spectrogram Transforms for Speech Enhancement by Image-to-image Translation
ガゾウ ヘンカン シュホウ ニヨル オンセイ キョウチョウ ノ タメノ スペクトログラム ヘンカン
Author
氏名 黒澤 義明
ヨミ クロサワ ヨシアキ
別名 KUROSAWA Yoshiaki
氏名 目良 和也
ヨミ メラ カズヤ
別名 MERA Kazuya
氏名 竹澤 寿幸
ヨミ タケザワ トシユキ
別名 TAKEZAWA Toshiyuki
Abstract

We aimed to examine well-known image-to-image translation technique, so-called pix2pix based on deep neural networks. Focusing on time-frequency analysis and implementing auxiliary classifier generative adversarial networks (ACGAN), we estimated the transform performance of spectrograms for sound enhancement. As a result using an image index, SSIM, we confirmed to slightly improve its performance compared to the original research.

Description

2020年度(第34回) : 2020年6月9日-6月12日 : オンライン

Journal Title
人工知能学会全国大会論文集
Volume
34
Spage
1
Epage
4
Published Date
2020
Publisher
人工知能学会
NCID
AA11578981
DOI
Language
jpn
NIIType
Conference Paper
Text Version
出版社版
Rights
本著作物の著作権は人工知能学会に帰属します。本著作物は著作権者である人工知能学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」に従うことをお願いいたします。
Relation URL
Note

3Rin4-59
本研究の一部は国立研究開発法人科学技術振興機構(JST)の研究成果展開事業「センター・オブ・イノベーション(COI)プログラム」グラント番号JPMJCE1311の支援によって行われている。また、広島市立大学特定研究費(先端学術研究費H27~29,30年度科研費獲得支援費)の支援を得ている。

Set
hiroshima-cu