People
音声処理の開発者および研究者。2013年に名古屋工業大学大学院博士前期課程修了。チームラボ株式会社を経て、2018年2月にLINE株式会社(現、LINEヤフー株式会社)に入社(現職)。2018年9月から2019年7月までNAVER Corp. Clova Voiceチームにて音声研究を行う。音声合成の研究開発に従事。WaveNetやTacotronに代表される音声合成に関するオープンソースソフトウェアを多数公開。著書「Pythonで学ぶ音声合成 機械学習実践シリーズ」インプレス出版
Publications
-
- カンファレンス (国際)
- Semi-Supervised Speaker Adaptation for End-to-End Speech Synthesis with Pretrained Models
- Katsuki Inoue (Okayama University), Sunao Hara (Okayama University), Masanobu Abe (Okayama University), Tomoki Hayashi (Nagoya University), Ryuichi Yamamoto, Shinji Watanabe (Johns Hopkins University)
- 2020 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2020.5.4
-
- カンファレンス (国内)
- (招待講演)End-to-end 音声合成の研究を加速させるオープンソースツールキット ESPnet-TTS
- 林 知樹 (名古屋大学), 山本 龍一, 井上 勝喜 (岡山大学), 吉村 建慶 (岡山大学), 武田 一哉 (名古屋大学), 戸田 智基 (名古屋大学), 渡部 晋治 (Johns Hopkins University)
- 日本音響学会 2020年春季研究発表会
- 2020.3.16
-
- カンファレンス (国内)
- End-to-End 音声認識を用いた音声合成の半教師あり話者適応
- 井上 勝喜 (岡山大学), 原 直 (岡山大学), 阿部 匡伸 (岡山大学), 林 知樹 (名古屋大学), 山本 龍一, 渡部 晋治 (Johns Hopkins University)
- 日本音響学会 2020年春季研究発表会
- 2020.3.16
-
- ワークショップ (国際)
- A Comparative Study on Transformer vs RNN in Speech Applications
- Shigeki Karita (NTT), Nanxin Chen (Johns Hopkins University), Tomoki Hayashi (Nagoya University, Human Dataware Lab. Co., Ltd.), Takaaki Hori (Mitsubishi Electric Research Laboratories,), Hirofumi Inaguma (Kyoto University), Ziyan Jiang (Johns Hopkins University), Masao Someki (Nagoya University), Nelson Enrique Yalta Soplin (Waseda University), Ryuichi Yamamoto, Xiaofei Wang (Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Takenori Yoshimura (Nagoya University, Human Dataware Lab. Co., Ltd.), Wangyou Zhang (Shanghai Jiao Tong University)
- 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU)
- 2019.12.14
-
- カンファレンス (国際)
- Probability Density Distillation with Generative Adversarial Networks for High-Quality Parallel Waveform Generation
- Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- The 20th Annual Conference of the International Speech Communication Association
- 2019.9.15