People
音声処理の開発者および研究者。2013年に名古屋工業大学大学院博士前期課程修了。チームラボ株式会社を経て、2018年2月にLINE株式会社(現、LINEヤフー株式会社)に入社(現職)。2018年9月から2019年7月までNAVER Corp. Clova Voiceチームにて音声研究を行う。音声合成の研究開発に従事。WaveNetやTacotronに代表される音声合成に関するオープンソースソフトウェアを多数公開。著書「Pythonで学ぶ音声合成 機械学習実践シリーズ」インプレス出版
Publications
-
- カンファレンス (国際)
- TTS-by-TTS 2: Data-selective Augmentation for Neural Speech Synthesis Using Ranking Support Vector Machine with Variational Autoencoder
- Eunwoo Song (NAVER), Ryuichi Yamamoto, Ohsung Kwon (NAVER), Chan-Ho Song, Min-Jae Hwang (NAVER), Suhyeon Oh (NAVER), Hyun-Wook Yoon (NAVER), Jin-Seob Kim (NAVER), Jae-Min Kim (NAVER)
- The 23rd Annual Conference of the International Speech Communication Association
- 2022.9.18
-
- その他 (国内)
- 国際会議Interspeech2021参加報告
- 田中 智大 (NTT), 山本 龍一
- 第251回自然言語処理・第139回音声言語情報処理合同研究発表会
- 2021.11.24
-
- カンファレンス (国内)
- テキスト音声合成のための CycleGAN 声質変換を用いたデータ拡張の検討
- 寺島 涼, 山本 龍一, 橘 健太郎
- 日本音響学会 2021年秋季研究発表会
- 2021.9.7
-
- カンファレンス (国際)
- High-fidelity Parallel WaveGAN with Multi-band Harmonic-plus-Noise Model
- Min-Jae Hwang (Search Solutions Inc), Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- The 22nd Annual Conference of the International Speech Communication Association
- 2021.8.30
-
- カンファレンス (国際)
- Phrase break prediction with bidirectional encoder representations in Japanese text-to-speech synthesis
- Kosuke Futamata, Byeongseon Park, Ryuichi Yamamoto, Kentaro Tachibana
- The 22nd Annual Conference of the International Speech Communication Association
- 2021.8.30
-
- ワークショップ (国際)
- Improved Parallel WaveGAN with perceptually weighted spectrogram loss
- Eunwoo Song (NAVER), Ryuichi Yamamoto, Min-Jae Hwang (NAVER), Jin-Seob Kim (NAVER), Ohsung Kwon (NAVER), Jae-Min Kim (NAVER)
- 2021 IEEE Spoken Language Technology Workshop (SLT)
- 2021.6.19
-
- カンファレンス (国際)
- Parallel Waveform Synthesis Based on Generative Adversarial Networks with Voicing-Aware Conditional Discriminators
- Ryuichi Yamamoto, Eunwoo Song (NAVER), Min-Jae Hwang (Search Solutions Inc), Jae-Min Kim (NAVER)
- 2021 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2021.6.6
-
- カンファレンス (国際)
- TTS-by-TTS: TTS-Driven Data Augmentation for Fast and High-Quality Speech Synthesis
- Min-Jae Hwang (Search Solutions Inc), Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- 2021 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2021.6.6
-
- カンファレンス (国際)
- Neural Text-to-Speech with a Modeling-by-Generation Excitation Vocoder
- Eunwoo Song (NAVER), Min-Jae Hwang (Search Solutions Inc.), Ryuichi Yamamoto, Jin-Seob Kim (NAVER), Ohsung Kwon (NAVER), Jae-Min Kim (NAVER)
- The 21st Annual Conference of the International Speech Communication Association
- 2020.10.25
-
- カンファレンス (国際)
- ESPnet-TTS: Unified, Reproducible, and Integratable Open Source End-to-End Text-to-Speech Toolkit
- Tomoki Hayashi (Nagoya University), Ryuichi Yamamoto, Katsuki Inoue (Okayama University), Takenori Yoshimura (Nagoya University), Shinji Watanabe (Johns Hopkins University), Tomoki Toda (Nagoya University), Kazuya Takeda (Nagoya University), Yu Zhang (Google AI), Xu Tan (Microsoft Research)
- 2020 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2020.5.4
-
- カンファレンス (国際)
- Improving LPCNet-Based Text-to-Speech with Linear Prediction-Structured Mixture Density Network
- Min-Jae Hwang (Search Solutions Inc), Eunwoo Song (NAVER), Ryuichi Yamamoto, Frank Soong (Microsoft Research Asia), Hong-Goo Kang (Yonsei University)
- 2020 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2020.5.4
-
- カンファレンス (国際)
- Parallel WaveGAN: A Fast Waveform Generation Model Based on Generative Adversarial Networks with Multi-Resolution Spectrogram
- Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- 2020 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2020.5.4
-
- カンファレンス (国際)
- Semi-Supervised Speaker Adaptation for End-to-End Speech Synthesis with Pretrained Models
- Katsuki Inoue (Okayama University), Sunao Hara (Okayama University), Masanobu Abe (Okayama University), Tomoki Hayashi (Nagoya University), Ryuichi Yamamoto, Shinji Watanabe (Johns Hopkins University)
- 2020 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2020.5.4
-
- カンファレンス (国内)
- (招待講演)End-to-end 音声合成の研究を加速させるオープンソースツールキット ESPnet-TTS
- 林 知樹 (名古屋大学), 山本 龍一, 井上 勝喜 (岡山大学), 吉村 建慶 (岡山大学), 武田 一哉 (名古屋大学), 戸田 智基 (名古屋大学), 渡部 晋治 (Johns Hopkins University)
- 日本音響学会 2020年春季研究発表会
- 2020.3.16
-
- カンファレンス (国内)
- End-to-End 音声認識を用いた音声合成の半教師あり話者適応
- 井上 勝喜 (岡山大学), 原 直 (岡山大学), 阿部 匡伸 (岡山大学), 林 知樹 (名古屋大学), 山本 龍一, 渡部 晋治 (Johns Hopkins University)
- 日本音響学会 2020年春季研究発表会
- 2020.3.16
-
- ワークショップ (国際)
- A Comparative Study on Transformer vs RNN in Speech Applications
- Shigeki Karita (NTT), Nanxin Chen (Johns Hopkins University), Tomoki Hayashi (Nagoya University, Human Dataware Lab. Co., Ltd.), Takaaki Hori (Mitsubishi Electric Research Laboratories,), Hirofumi Inaguma (Kyoto University), Ziyan Jiang (Johns Hopkins University), Masao Someki (Nagoya University), Nelson Enrique Yalta Soplin (Waseda University), Ryuichi Yamamoto, Xiaofei Wang (Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Takenori Yoshimura (Nagoya University, Human Dataware Lab. Co., Ltd.), Wangyou Zhang (Shanghai Jiao Tong University)
- 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU)
- 2019.12.14
-
- カンファレンス (国際)
- Probability Density Distillation with Generative Adversarial Networks for High-Quality Parallel Waveform Generation
- Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- The 20th Annual Conference of the International Speech Communication Association
- 2019.9.15