Publications

CONFERENCE (DOMESTIC)
NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア: 山本龍一 (名古屋大学/LINE), 米山怜於 (名古屋大学), 戸田智基 (名古屋大学); 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn); September 26, 2023

CONFERENCE (DOMESTIC)
独立低ランク行列分析における iterative projection with adjustment を用いた分離行列の更新: 蓮実拓也, シャイブラーロビン; 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn); September 26, 2023

CONFERENCE (DOMESTIC)
Foley Sound Synthesis with a Class-Conditioned Latent Diffusion Model and FAD-Based Post-filtering: シャイブラーロビン, 蓮実拓也, 藤田雄介, 小松達也, 山本龍一, 橘健太郎; 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn); September 26, 2023

CONFERENCE (DOMESTIC)
データの分布マッチングによる End-to-End 音声認識モデルのドメイン適応: 篠原雄介, 渡部晋治 (CMU); 日本音響学会第150回（2023年秋季）研究発表会; September 26, 2023

CONFERENCE (DOMESTIC)
潜在変数モデルを用いたCTCによる非自己回帰型音声認識: 藤田悠哉, 渡部晋治 (カーネギーメロン大学); 日本音響学会第150回(2023年秋季)研究発表会; September 26, 2023

WORKSHOP (INTERNATIONAL)
Foley Sound Synthesis with a Class-conditioned Latent Diffusion Model: Robin Scheibler, Takuya Hasumi, Yusuke Fujita, Tatsuya Komatsu, Ryuichi Yamamoto, Kentaro Tachibana; Detection and Classification of Acoustic Scenes and Events (DCASE 2023); September 20, 2023

CONFERENCE (INTERNATIONAL)
CALLS: Japanese Empathetic Dialogue Speech Corpus of Complaint Handling and Attentive Listening in Customer Center: Yuki Saito (The University of Tokyo), Eiji Iimori (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo); The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023); August 20, 2023

CONFERENCE (INTERNATIONAL)
ChatGPT-EDSS: Empathetic Dialogue Speech Synthesis Trained from ChatGPT-derived Context Word Embeddings: Yuki Saito (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Eiji Iimori (The University of Tokyo), Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo); The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023); August 20, 2023

CONFERENCE (INTERNATIONAL)
Exploration of Efficient End-to-End ASR using Discretized Input from Self-Supervised Learning: Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University); The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023); August 20, 2023

CONFERENCE (INTERNATIONAL)
Multi-channel separation of dynamic speech and sound events: Takuya Fujimura (Nagoya University), Robin Scheibler; The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023); August 20, 2023

CONFERENCE (INTERNATIONAL)
Target Vocabulary Recognition Based on Multi-Task Learning with Decomposed Teacher Sequences: Aoi Ito (Hosei University), Tatsuya Komatsu, Yusuke Fujita, Yusuke Kida; The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023); August 20, 2023

JOURNAL (INTERNATIONAL)
Audio Signal Processing in the 21st Century: Gaël Richard (Telecom-Paris), Paris Smaragdis (University of Illinois Urbana-Champaign), Sharon Gannot (Bar-Ilan University), Patrick A. Naylor (Imperial College London), Shoji Makino (Waseda University), Walter Kellermann (University of Erlangen-N ̈urnberg), Akihiko Sugiyama; IEEE Signal Processing Magazine (Signal Processing Magazine); July 19, 2023

WORKSHOP (DOMESTIC)
ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル: 齋藤佑樹 (東京大学), 高道慎之介 (東京大学), 飯森英治 (東京大学), 橘健太郎, 猿渡洋 (東京大学); 第137回MUS・第147回SLP合同研究発表会 (音学シンポジウム 2023); June 23, 2023

CONFERENCE (INTERNATIONAL)
Fully Unsupervised Topic Clustering of Unlabelled Spoken Audio Using Self-Supervised Representation Learning and Topic Model: Takashi Maekaku, Yuya Fujita, Xuankai Chang (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University); The International Conference on Acoustics, Speech, & Signal Processing 2023 (ICASSP 2023); June 07, 2023

CONFERENCE (INTERNATIONAL)
Adaptive Noise Canceller Algorithm with SNR-Based Stepsize and Data-Dependent Averaging: Akihiko Sugiyama; 2023 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 05, 2023

CONFERENCE (INTERNATIONAL)
Linear Microphone Array Parallel to the Driving Direction for In-Car Speech Enhancement: Masanori Tsujikawa (NEC), Akihiko Sugiyama, Ken Hanazawa (NEC America), Yoshinobu Kajikawa (Kansai University); 2023 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 05, 2023

CONFERENCE (INTERNATIONAL)
Conversation-oriented ASR with multi-look-ahead CBS architecture: Huaibo Zhao (Waseda University), Shinya Fujie (Waseda University), Tetsuji Ogawa (Waseda University), Jin Sakuma (Waseda University), Yusuke Kida, Tetsunori Kobayashi (Waseda University); 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 04, 2023

CONFERENCE (INTERNATIONAL)
Diffusion-based Generative Speech Source Separation: Robin Scheibler, Youna Ji (NAVER Cloud), Soo-Whan Chung (NAVER Cloud), Jaeuk Byun (NAVER Cloud), Soyeon Choe (NAVER Cloud), Min-Seok Choi (NAVER Cloud); 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 04, 2023

CONFERENCE (INTERNATIONAL)
Effectiveness of Inter- and Intra-subarray Spatial Features for Acoustic Scene Classification: Takao Kawamura (Tokyo Metropolitan University), Yuma Kinoshita (Tokyo Metropolitan University), Nobutaka Ono (Tokyo Metropolitan University), Robin Scheibler; 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 04, 2023

CONFERENCE (INTERNATIONAL)
Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform: Masaya Kawamura (The University of Tokyo), Yuma Shirahata, Ryuichi Yamamoto, Kentaro Tachibana; 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023); June 04, 2023