Ryuichi Yamamoto - LY Corporation R&D

CONFERENCE (INTERNATIONAL)
CC-G2PNP: Streaming Grapheme-to-Phoneme and Prosody with Conformer-CTC for Unsegmented Languages: Yuma Shirahata, Ryuichi Yamamoto; 2026 IEEE International Conference on Acoustics, Speech and Signal Processing; May 07, 2026

CONFERENCE (DOMESTIC)
BitTTS: 1.58-bit量子化と重みインデキシングによる軽量なテキスト音声合成: 川村真也, 蓮実拓也, 白旗悠真, 山本龍一; 日本音響学会 2025年秋季研究発表会; September 11, 2025

CONFERENCE (DOMESTIC)
音声からの音素・韻律ラベルの獲得とその応用: 白旗悠真, 朴炳宣, 山本龍一; 日本音響学会 2025年秋季研究発表会; September 10, 2025

CONFERENCE (INTERNATIONAL)
BitTTS: Highly Compact Text-to-Speech Using 1.58-bit Quantization and Weight Indexing: Masaya Kawamura, Takuya Hasumi, Yuma Shirahata, Ryuichi Yamamoto; The 26th Annual Conference of the International Speech Communication Association; August 21, 2025

CONFERENCE (INTERNATIONAL)
Comparative Analysis of Fast and High-Fidelity Neural Vocoders for Low-Latency Streaming Synthesis in Resource-Constrained Environments: Reo Yoneyama (Nagoya University), Masaya Kawamura, Ryo Terashima, Ryuichi Yamamoto (Nagoya University/LY Corporation), Tomoki Toda (Nagoya University); The 26th Annual Conference of the International Speech Communication Association; August 21, 2025

CONFERENCE (INTERNATIONAL)
Grapheme-Coherent Phonemic and Prosodic Annotation of Speech by Implicit and Explicit Grapheme Conditioning: Hien Ohnaka (Nara Institute of Science and Technology), Yuma Shirahata, Byeongseon Park, Ryuichi Yamamoto; The 26th Annual Conference of the International Speech Communication Association; August 17, 2025

CONFERENCE (INTERNATIONAL)
Description-Based Controllable Text-to-Speech With Cross-Lingual Voice Control: Ryuichi Yamamoto, Yuma Shirahata, Masaya Kawamura, Kentaro Tachibana; 2025 IEEE International Conference on Acoustics, Speech and Signal Processing; April 06, 2025

CONFERENCE (INTERNATIONAL)
Investigating Factors Related to the Naturalness of Synthesized Unison Singing: Kaito Nishizawa (Nagoya University), Ryuichi Yamamoto, Wen-Chin Huang (Nagoya University), Tomoki Toda (Nagoya University); 2025 IEEE International Conference on Acoustics, Speech and Signal Processing; April 06, 2025

CONFERENCE (DOMESTIC)
Wavehax：調波信号モデルと２次元畳み込みを用いた複素スペクトログラム推定に基づくエイリアシングフリーニューラルボコーダ: 米山怜於 (名大), 宮下敦志 (名大), 山本龍一, 戸田智基 (名大); 日本音響学会 2025年春季研究発表会; March 17, 2025

OTHERS (INTERNATIONAL)
Description-based Controllable Text-to-Speech with Cross-Lingual Voice Control: Ryuichi Yamamoto, Yuma Shirahata, Masaya Kawamura, Kentaro Tachibana; arXiv.org; September 27, 2024

CONFERENCE (INTERNATIONAL)
Audio-conditioned phonemic and prosodic annotation for building text-to-speech models from unlabeled speech data: Yuma Shirahata, Byeongseon Park, Ryuichi Yamamoto, Kentaro Tachibana; The 25th Annual Conference of the International Speech Communication Association; September 04, 2024

CONFERENCE (DOMESTIC)
感情音声合成のためのアラインメント手法の比較: 蓮実拓也, 白旗悠真, Welly Naptali, 山本龍一, Eunwoo Song (NAVER Cloud), 橘健太郎, Jae-Min Kim (NAVER Cloud); 日本音響学会 2024年秋季研究発表会; September 04, 2024

CONFERENCE (INTERNATIONAL)
LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning: Masaya Kawamura, Ryuichi Yamamoto, Yuma Shirahata, Takuya Hasumi, Kentaro Tachibana; The 25th Annual Conference of the International Speech Communication Association; September 03, 2024

CONFERENCE (INTERNATIONAL)
Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment: Takuto Igarashi (The University of Tokyo), Yuki Saito (The University of Tokyo), Kentaro Seki (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Ryuichi Yamamoto, Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo); The 25th Annual Conference of the International Speech Communication Association; September 01, 2024

CONFERENCE (INTERNATIONAL)
SRC4VC: Smartphone-Recorded Corpus for Voice Conversion Benchmark: Yuki Saito (The University of Tokyo), Takuto Igarashi (The University of Tokyo), Kentaro Seki (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Ryuichi Yamamoto, Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo); The 25th Annual Conference of the International Speech Communication Association; September 01, 2024

CONFERENCE (INTERNATIONAL)
Enhancing Multilingual TTS with Voice Conversion Based Data Augmentation and Posterior Embedding: Hyun-Wook Yoon (NAVER Cloud), Jin-Seob Kim (NAVER Cloud), Ryuichi Yamamoto, Ryo Terashima, Chan-Ho Song (NAVER Cloud), Jae-Min Kim (NAVER Cloud), Eunwoo Song (NAVER Cloud); 2024 IEEE International Conference on Acoustics, Speech and Signal Processing; April 14, 2024

CONFERENCE (INTERNATIONAL)
PromptTTS++: Controlling Speaker Identity in Prompt-Based Text-To-Speech Using Natural Language Descriptions: Reo Shimizu (Tohoku University), Ryuichi Yamamoto, Masaya Kawamura, Yuma Shirahata, Hironori Doi, Tatsuya Komatsu, Kentaro Tachibana; 2024 IEEE International Conference on Acoustics, Speech and Signal Processing; April 14, 2024

CONFERENCE (DOMESTIC)
音声品質と音響環境の潜在変数で条件付けたDenoising Trainingによるノイズロバスト音声変換: 五十嵐琢斗 (東京大学), 齋藤佑樹 (東京大学), 関健太郎 (東京大学), 高道慎之介 (東京大学), 山本龍一, 橘健太郎, 猿渡洋 (東京大学); 電子情報通信学会/日本音響学会音声研究会; February 22, 2024

CONFERENCE (DOMESTIC)
NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア: 山本龍一 (名古屋大学/LINE), 米山怜於 (名古屋大学), 戸田智基 (名古屋大学); 日本音響学会 2023年秋季研究発表会; September 26, 2023

CONFERENCE (DOMESTIC)
Foley Sound Synthesis with a Class-Conditioned Latent Diffusion Model and FAD-Based Post-filtering: シャイブラーロビン, 蓮実拓也, 藤田雄介, 小松達也, 山本龍一, 橘健太郎; 日本音響学会 2023年秋季研究発表会; September 26, 2023

LY Corporation R&D