Publications

ワークショップ (国内)
ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル: 齋藤佑樹 (東京大学), 高道慎之介 (東京大学), 飯森英治 (東京大学), 橘健太郎, 猿渡洋 (東京大学); 第137回MUS・第147回SLP合同研究発表会 (音学シンポジウム 2023); 2023.6.23

カンファレンス (国際)
Diffusion-based Generative Speech Source Separation: Robin Scheibler, Youna Ji (NAVER Cloud), Soo-Whan Chung (NAVER Cloud), Jaeuk Byun (NAVER Cloud), Soyeon Choe (NAVER Cloud), Min-Seok Choi (NAVER Cloud); 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); 2023.6.4

カンファレンス (国際)
Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform: Masaya Kawamura (The University of Tokyo), Yuma Shirahata, Ryuichi Yamamoto, Kentaro Tachibana; 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); 2023.6.4

カンファレンス (国際)
NNSVS: A Neural Network-Based Singing Voice Synthesis Toolkit: Ryuichi Yamamoto (LINE/Nagoya University), Reo Yoneyama (Nagoya University), Tomoki Toda (Nagoya University); 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); 2023.6.4

カンファレンス (国際)
Non-parallel High-Quality Audio Super Resolution with Domain Adaptation and Resampling CycleGANs: Reo Yoneyama (Nagoya University), Ryuichi Yamamoto, Kentaro Tachibana; 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); 2023.6.4

カンファレンス (国際)
Period VITS: Variational Inference With Explicit Pitch Modeling For End-to-End Emotional Speech: Yuma Shirahata, Ryuichi Yamamoto, Eunwoo Song (NAVER), Ryo Terashima, Jae-Min Kim (NAVER), Kentaro Tachibana; 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); 2023.6.4

カンファレンス (国内)
Diffusion-Mixing Process for Speech Source Separation: シャイブラーロビン, Ji Youna (NAVER), Chung Soo-Whan (NAVER), Byun Jaeuk (NAVER), Choe Soyeon (NAVER), Choi Min-Seok (NAVER); 日本音響学会 2023年春季研究発表会 (ASJ 2023 spring); 2023.3.15

カンファレンス (国内)
フォローアップ発話を用いた日本語対話の自動評価: 川本稔己 (LINE/東京工業大学), 岡野裕紀 (東京工業大学), 山崎天, 佐藤敏紀, 船越孝太郎 (東京工業大学), 奥村学 (東京工業大学); 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

その他 (国内)
個々の役割を指示可能な入力言語に応じた2人のインタラクションの動作生成の検討: 田中幹大, 近藤雅芳, 藤原研人; 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

カンファレンス (国内)
対話システムにおけるペルソナの自動生成による更新: 川本稔己 (LINE/東京工業大学), 山崎天, 佐藤敏紀, 船越孝太郎 (東京工業大学), 奥村学 (東京工業大学); 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

カンファレンス (国内)
対話システムは疑問符なしで適切な応答生成できる？ ?音声対話を目的とした，疑問文に対する応答生成の調査?: 水本智也, 山崎天, 吉川克正, 大萩雅也, 川本稔己 (LINE/東京工業大学), 佐藤敏紀; 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

その他 (国内)
日本語有害表現スキーマの提案と評価: 小林滉河, 山崎天, 吉川克正, 牧田光晴, 中町礼文, 佐藤京也 (LINE/東京都立大学), 浅原正幸 (国立国語研究所), 佐藤敏紀; 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

カンファレンス (国内)
語彙と品質を考慮したデータ水増しの言語教育支援への適用: 中町礼文, 西内沙恵 (北海道教育大学), 浅原正幸 (国立国語研究所), 佐藤敏紀; 言語処理学会第29回年次大会 (NLP 2023); 2023.3.13

ワークショップ (国内)
HyperCLOVA を用いた音声雑談対話システム: 山崎天, 川本稔己 (LINE/東京工業大学), 大萩雅也, 水本智也, 小林滉河, 吉川克正, 佐藤敏紀; 第13回対話システムシンポジウム (第13回対話システムシンポジウム); 2022.12.13

ワークショップ (国内)
シチュエーションに合わせたシナリオ誘導とHyperCLOVAを利用した応答生成によるハイブリッド対話システム: 吉川克正, 川本稔己 (LINE/東京工業大学), 山崎天, 水本智也, 小林滉河, 大萩雅也, 佐藤敏紀; 第13回対話システムシンポジウム (第13回対話システムシンポジウム); 2022.12.13

ワークショップ (国際)
Tourist Guidance Robot Based on HyperCLOVA: Takato Yamazaki, Katsumasa Yoshikawa, Toshiki Kawamoto (LINE/Tokyo Institute of Technology), Masaya Ohagi, Tomoya Mizumoto, Shuta Ichimura, Yusuke Kida, Toshinori Sato; The 2022 IEEE/RSJ International Conference on Intelligent Robots and Systems - Dialogue Robot Competition 2022 (IROS 2022 - DRC2022); 2022.10.25

その他 (国内)
言語モデルの倫理的検査のための効率的なテストケースの生成: 綿岡晃輝, 野崎雄斗 (東京都大学), 馬越雅人, 髙橋翼; コンピュータセキュリティシンポジウム2022 (CSS 2022); 2022.10.24

カンファレンス (国際)
Acoustic Modeling for End-to-End Empathetic Dialogue Speech Synthesis Using Linguistic and Prosodic Contexts of Dialogue History: Yuto Nishimura (The University of Tokyo), Yuki Saito (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo); The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH 2022); 2022.9.18

カンファレンス (国際)
Cross-Speaker Emotion Transfer for Low-Resource Text-to-Speech Using Non-Parallel Voice Conversion with Pitch-Shift Data Augmentation: Ryo Terashima, Ryuichi Yamamoto, Eunwoo Song (NAVER), Yuma Shirahata, Hyun-Wook Yoon (NAVER), Jae-Min Kim (NAVER), Kentaro Tachibana; The 23rd Annual Conference of the International Speech Communication Association (INTERSPEECH 2022); 2022.9.18