音声処理
-
- カンファレンス (国際)
- Robust Adaptive Noise Canceller Algorithm with SNR-Based Stepsize Control and Noise-Path Gain Compensation
- Akihiko Sugiyama
- 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2022)
- 2022.5.8
-
- カンファレンス (国際)
- Non-Autoregressive End-to-End Automatic Speech Recognition Incorporating Downstream Natural Language Processing
- Motoi Omachi, Yuya Fujita, Shinji Watanabe (Carnegie Mellon University), Tianzi Wang (Johns Hopkins University)
- 2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2022)
- 2022.4.27
-
- その他 (国際)
- End-to-End Integration of Speech Recognition, Speech Enhancement, and Self-Supervised Learning Representation
- Xuankai Chang (Carnegie Mellon University), Takashi Maekaku, Yuya Fujita, Shinji Watanabe (Carnegie Mellon University)
- arXiv.org (arXiv)
- 2022.4.1
-
- カンファレンス (国内)
- STUDIES:表現豊かな音声合成に向けた日本語共感的対話音声コーパス
- 齋藤 佑樹 (東京大学), 西邑 勇人 (東京大学), 高道 慎之介 (東京大学), 橘 健太郎, 猿渡 洋 (東京大学)
- 日本音響学会 2022年春季研究発表会 (ASJ 2022 spring)
- 2022.3.9
-
- カンファレンス (国内)
- 音響シーンとイベントが相互に及ぼす影響の調査
- 小松 由佳 (同志社大学), 井本 桂右 (同志社大学), 小松 達也
- 日本音響学会 2022年春季研究発表会 (ASJ 2022 spring)
- 2022.3.9
-
- ワークショップ (国内)
- 対話履歴の韻律情報を考慮した共感的対話音声合成
- 西邑 勇人 (東京大学), 齋藤 佑樹 (東京大学), 高道 慎之介 (東京大学), 橘 健太郎, 猿渡 洋 (東京大学)
- 第140回音声言語情報処理研究発表会 (SLP 2022)
- 2022.3.1
-
- カンファレンス (国際)
- Robust Noise Canceller Algorithm with SNR-Based Stepsize Control and Gain Adjustment
- Akihiko Sugiyama
- International Conference on Consumer Electronics 2022 (ICCE2022)
- 2022.1.7
-
- ワークショップ (国際)
- An Exploration of Self-Supervised Pretrained Representations for End-to-End Speech Recognition
- Xuankai Chang (Carnegie Mellon University), Takashi Maekaku, Pengcheng Guo (Northwestern Polytechnical University), Jing Shi (Institute of Automation, Chinese Academy of Sciences), Yen, Aswin Shanmugam Subramanian (Johns Hopkins University), Tianzi Wang (Johns Hopkins University), Shu, Yu Tsao (Academia Sinica), Hung, Shinji Watanabe (Carnegie Mellon University)
- IEEE Automatic Speech Recognition and Understanding Workshop 2021 (ASRU 2021)
- 2021.12.15
-
- ワークショップ (国際)
- A Comparative Study on Non-Autoregressive Modelings for Speech-to-Text Generation
- Yosuke Higuchi (Waseda University), Nanxin Chen (Johns Hopkins University), Yuya Fujita, Hirofumi Inaguma (Kyoto University), Tatsuya Komatsu (LINE Corporation), Jaesong Lee (Naver Corporation), Jumon Nozaki (Kyoto University, LINE Corporation), Tianzi Wang (Johns Hopkins University), Shinji Watanabe (Carnegie Mellon University)
- The 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2021)
- 2021.12.14
-
- カンファレンス (国際)
- Comparison of Low Complexity Self-Attention Mechanisms for Acoustic Event Detection
- Tatsuya Komatsu, Robin Scheilbler
- Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021 (APSIPA ASC 2021)
- 2021.12.14
-
- カンファレンス (国際)
- Over-Determined Semi-Blind Speech Source Separation
- Masahito Togami, Robin Scheilbler
- Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2021 (APSIPA ASC 2021)
- 2021.12.14
-
- ワークショップ (国際)
- A Comparative Study on Non-Autoregressive Modelings for Speech-to-Text Generation
- Yosuke Higuchi (Waseda University), Nanxin Chen (Johns Hopkins University), Yuya Fujita (Yahoo Japan Corporation), Hirofumi Inaguma (Kyoto University), Tatsuya Komatsu, Jaesong Lee (Naver Corporation), Jumon Nozaki (Kyoto University), Tianzi Wang (Johns Hopkins University), Shinji Watanabe (Carnegie Mellon University)
- 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) (ASRU 2021)
- 2021.12.13
-
- ワークショップ (国際)
- A Study of Transducer Based End-to-End ASR with ESPnet: Architecture, Auxiliary Loss and Decoding Strategies
- Florian Boyer (Airudit, University of Bordeaux), Yusuke Shinohara, Takaaki Ishii, Hirofumi Inaguma (Kyoto University), Shinji Watanabe (Carnegie Mellon University)
- The 2021 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2021)
- 2021.12.13
-
- 論文誌 (国際)
- Computationally-Efficient Overdetermined Blind Source Separation Based on Iterative Source Steering
- Yicheng Du (Kyoto University), Robin Scheibler, Masahito Togami, Kazuyoshi Yoshii (Kyoto University), Tatsuya Kawahara (Kyoto University)
- IEEE Signal Processing Letters (IEEE SPL)
- 2021.12.13
-
- その他 (国内)
- 国際会議Interspeech2021参加報告
- 田中 智大 (NTT), 山本 龍一
- 第251回自然言語処理・第139回音声言語情報処理合同研究発表会 (SLP/NL 2021)
- 2021.11.24
-
- その他 (国際)
- A Comparative Study on Non-Autoregressive Modelings for Speech-to-Text Generation
- Yosuke Higuchi (Waseda University), Nanxin Chen (Johns Hopkins University), Yuya Fujita, Hirofumi Inaguma (Kyoto University), Tatsuya Komatsu (LINE Corporation), Jaesong Lee (Naver Corporation), Jumon Nozaki (Kyoto University, LINE Corporation), Tianzi Wang (Johns Hopkins University), Shinji Watanabe (Carnegie Mellon University)
- arXiv
- 2021.10.11
-
- カンファレンス (国内)
- Conformer CPCとDeep Cluster を用いたゼロリソース言語のための表現学習
- 前角 高史, Xuankai Chang (カーネギーメロン大学), 藤田 悠哉, Li-Wei Chen (カーネギーメロン大学), 渡部 晋治(カーネギーメロン大学), Alexander Rudnicky (カーネギーメロン大学)
- 日本音響学会2021年秋季研究発表会
- 2021.9.8
-
- カンファレンス (国内)
- CTC を用いた音声認識のための中間層予測による条件づけ
- 野崎 樹文 (京都大学), 小松 達也
- 日本音響学会 2021年秋季研究発表会 (ASJ 2021 autumn)
- 2021.9.7
-
- カンファレンス (国内)
- テキスト音声合成のための CycleGAN 声質変換を用いたデータ拡張の検討
- 寺島 涼, 山本 龍一, 橘 健太郎
- 日本音響学会 2021年秋季研究発表会 (ASJ 2021 autumn)
- 2021.9.7
-
- カンファレンス (国内)
- 音声意味理解への応用を指向した非自己回帰型End-to-end音声認識
- 大町 基, 藤田 悠哉, 渡部 晋治 (Carnegie Mellon University), Tianzi Wang (Johns Hopkins University)
- 日本音響学会 2021年秋季研究発表会 (音響学会)
- 2021.9.7