Publications

カンファレンス (国内)
中間層予測に対するノイズ付与による CTC 音声認識の頑健性向上: 中込優, 小松達也, 藤田雄介, 市村収太, 木田祐介; 日本音響学会 2022年秋季研究発表会 (ASJ 2022 autumn); 2022.9.14

カンファレンス (国内)
中間層予測に音節と表記を用いる日本語音声認識: 藤田雄介, 小松達也, 木田祐介; 日本音響学会 2022年秋季研究発表会 (ASJ 2022 autumn); 2022.9.14

カンファレンス (国内)
微分可能な信号処理に基づく音声合成器を用いた DNN 音声パラメータ推定の検討: 松永裕太 (LINE/東京大学), 寺島涼, 橘健太郎; 日本音響学会 2022年秋季研究発表会 (ASJ 2022 autumn); 2022.9.14

カンファレンス (国内)
音響シーン認識のためのサブアレイ間相関特徴量の検討: 河村隆生 (東京都立大学), 木下裕磨 (東京都立大学/東海大学), 小野順貴 (東京都立大学), シャイブラーロビン; 日本音響学会 2022年秋季研究発表会 (ASJ 2022 autumn); 2022.9.14

ワークショップ (国際)
User Preference between Residual Noise and Speech Distortion in Speech Enhancement: Akihiko Sugiyama, Osamu Shimada (NEC Corporation), Toshiyuki Nomura (NEC Corporation); International Workshop on Acoustic Signal Enhancement (IWAENC); 2022.9.5

カンファレンス (国際)
Non-Autoregressive ASR with Self-Conditioned Folded Encoders: Tatsuya Komatsu; 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022); 2022.5.22

カンファレンス (国際)
SDR -- Medium Rare with Fast Computations: Robin Scheilbler; 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022); 2022.5.22

カンファレンス (国際)
Self-Supervised Learning Method Using Multiple Sampling Strategies for General-Purpose Audio Representation: Ibuki Kuroyanagi (Nagoya University), Tatsuya Komatsu; 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022); 2022.5.22

カンファレンス (国際)
An Exploration of Hubert with Large Number of Cluster Units and Model Assessment Using Bayesian Information Criterion: Takashi Maekaku, Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); The International Conference on Acoustics, Speech, & Signal Processing 2022 (ICASSP 2022); 2022.5.10

カンファレンス (国際)
Robust Adaptive Noise Canceller Algorithm with SNR-Based Stepsize Control and Noise-Path Gain Compensation: Akihiko Sugiyama; 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022); 2022.5.8

カンファレンス (国際)
Non-Autoregressive End-to-End Automatic Speech Recognition Incorporating Downstream Natural Language Processing: Motoi Omachi, Yuya Fujita, Shinji Watanabe (Carnegie Mellon University), Tianzi Wang (Johns Hopkins University); 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2022); 2022.4.27

その他 (国際)
End-to-End Integration of Speech Recognition, Speech Enhancement, and Self-Supervised Learning Representation: Xuankai Chang (Carnegie Mellon University), Takashi Maekaku, Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); arXiv.org (arXiv); 2022.4.1

カンファレンス (国内)
STUDIES：表現豊かな音声合成に向けた日本語共感的対話音声コーパス: 齋藤佑樹 (東京大学), 西邑勇人 (東京大学), 高道慎之介 (東京大学), 橘健太郎, 猿渡洋 (東京大学); 日本音響学会 2022年春季研究発表会 (ASJ 2022 spring); 2022.3.9

カンファレンス (国内)
音響シーンとイベントが相互に及ぼす影響の調査: 小松由佳 (同志社大学), 井本桂右 (同志社大学), 小松達也; 日本音響学会 2022年春季研究発表会 (ASJ 2022 spring); 2022.3.9

ワークショップ (国内)
対話履歴の韻律情報を考慮した共感的対話音声合成: 西邑勇人 (東京大学), 齋藤佑樹 (東京大学), 高道慎之介 (東京大学), 橘健太郎, 猿渡洋 (東京大学); 第140回音声言語情報処理研究発表会 (SLP 2022); 2022.3.1

カンファレンス (国際)
Robust Noise Canceller Algorithm with SNR-Based Stepsize Control and Gain Adjustment: Akihiko Sugiyama; International Conference on Consumer Electronics 2022 (ICCE2022); 2022.1.7

ワークショップ (国際)
An Exploration of Self-Supervised Pretrained Representations for End-to-End Speech Recognition: Xuankai Chang (Carnegie Mellon University), Takashi Maekaku, Pengcheng Guo (Northwestern Polytechnical University), Jing Shi (Institute of Automation, Chinese Academy of Sciences), Yen, Aswin Shanmugam Subramanian (Johns Hopkins University), Tianzi Wang (Johns Hopkins University), Shu, Yu Tsao (Academia Sinica), Hung, Shinji Watanabe (Carnegie Mellon University); IEEE Automatic Speech Recognition and Understanding Workshop 2021 (ASRU 2021); 2021.12.15

ワークショップ (国際)
A Comparative Study on Non-Autoregressive Modelings for Speech-to-Text Generation: Yosuke Higuchi (Waseda University), Nanxin Chen (Johns Hopkins University), Yuya Fujita, Hirofumi Inaguma (Kyoto University), Tatsuya Komatsu (LINE Corporation), Jaesong Lee (Naver Corporation), Jumon Nozaki (Kyoto University, LINE Corporation), Tianzi Wang (Johns Hopkins University), Shinji Watanabe (Carnegie Mellon University); The 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2021); 2021.12.14

カンファレンス (国際)
Comparison of Low Complexity Self-Attention Mechanisms for Acoustic Event Detection: Tatsuya Komatsu, Robin Scheilbler; Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021 (APSIPA ASC 2021); 2021.12.14

カンファレンス (国際)
Over-Determined Semi-Blind Speech Source Separation: Masahito Togami, Robin Scheilbler; Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021 (APSIPA ASC 2021); 2021.12.14