音声処理
-
- カンファレンス (国内)
- Self-attention を用いた弱教師あり音響イベント検出
- 宮崎 晃一 (名古屋大学), 小松 達也, 林 知樹 (名古屋大学), 渡部 晋治 (Johns Hopkins University), 戸田 智基 (名古屋大学), 武田 一哉 (名古屋大学)
- 日本音響学会 2020年春季研究発表会 (ASJ 2020 spring)
- 2020.3.16
-
- カンファレンス (国内)
- 所望音源の方向アトラクターに基づく時変の空間フィルタを用いた DNN 音声抽出
- 中込 優 (早稲田大学), 戸上 真人, 小川 哲司 (早稲田大学), 小林 哲則 (早稲田大学)
- 日本音響学会 2020年春季研究発表会 (ASJ 2020 spring)
- 2020.3.16
-
- カンファレンス (国内)
- End-to-End 音声認識を用いた音声合成の半教師あり話者適応
- 井上 勝喜 (岡山大学), 原 直 (岡山大学), 阿部 匡伸 (岡山大学), 林 知樹 (名古屋大学), 山本 龍一, 渡部 晋治 (Johns Hopkins University)
- 日本音響学会 2020年春季研究発表会 (ASJ 2020 spring)
- 2020.3.16
-
- カンファレンス (国内)
- 軽量・動的畳み込みを用いたend-to-end音声認識
- 藤田 悠哉, Aswin Shanmugam Subramanian*, 大町 基, 渡部晋治* (* Johns Hopkins University)
- 日本音響学会2020年春季研究発表会 (音響学会)
- 2020.3.9
-
- その他 (国際)
- Attention-based ASR with Lightweight and Dynamic Convolutions
- Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)
- arXiv.org
- 2020.2.20
-
- カンファレンス (国際)
- Fast Convergence Algorithm for Adaptive Noise Cancellers with SNR-Based Stepsize Control
- Akihiko Sugiyama
- International Conference on Consumer Electronics 2020 (ICCE2020)
- 2020.1.4
-
- ワークショップ (国際)
- A Comparative Study on Transformer vs RNN in Speech Applications
- Shigeki Karita (NTT), Nanxin Chen (Johns Hopkins University), Tomoki Hayashi (Nagoya University, Human Dataware Lab. Co., Ltd.), Takaaki Hori (Mitsubishi Electric Research Laboratories,), Hirofumi Inaguma (Kyoto University), Ziyan Jiang (Johns Hopkins University), Masao Someki (Nagoya University), Nelson Enrique Yalta Soplin (Waseda University), Ryuichi Yamamoto, Xiaofei Wang (Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Takenori Yoshimura (Nagoya University, Human Dataware Lab. Co., Ltd.), Wangyou Zhang (Shanghai Jiao Tong University)
- 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) (ASRU 2019)
- 2019.12.14
-
- ワークショップ (国際)
- Fast Convergence Algorithm for State-Space Model Based Speech Dereverberation by Multi-Channel Non-Negative Matrix Factorization
- Masahito Togami, Tatsuya Komatsu
- 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)
- 2019.10.20
-
- ワークショップ (国際)
- Generalized Weighted-Prediction-Error Dereverberation with Varying Source Priors for Reverberant Speech Recognition
- Toru Taniguchi, Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Dung Tran, Yuya Fujita, and Shinji Watanabe(Johns Hopkins Univ.)
- 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)
- 2019.10.20
-
- ワークショップ (国際)
- Speech Enhancement Using End-to-End Speech Recognition Objectives
- Aswin Shanmugam Subramanian(Johns Hopkins University), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Murali Karthick Baskar (Johns Hopkins Univ., Brno University of Technology), Toru Taniguchi, Dung Tran, and Yuya Fujita
- 2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)
- 2019.10.20
-
- カンファレンス (国際)
- Simultaneous Detection and Localization of a Wake-Up Word using Multi-Task Learning of the Duration and Endpoint
- Takashi Maekaku, Yusuke Kida, Akihiko Sugiyama
- The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)
- 2019.9.19
-
- カンファレンス (国際)
- Multichannel Loss Function for Supervised Speech Source Separation by Mask-based Beamforming
- Yoshiki Masuyama (Waseda University), Masahito Togami, Tatsuya Komatsu
- The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)
- 2019.9.15
-
- カンファレンス (国際)
- Probability Density Distillation with Generative Adversarial Networks for High-Quality Parallel Waveform Generation
- Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)
- The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)
- 2019.9.15
-
- カンファレンス (国際)
- Variational Bayesian Multi-channel Speech Dereverberation under Noisy Environments with Probabilistic Convolutive Transfer Function
- Masahito Togami, Tatsuya Komatsu
- The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)
- 2019.9.15
-
- カンファレンス (国内)
- 多様な環境音の合成と変換のための基礎検討
- 岡本 悠希 (立命館大学), 柳生 拓巳 (立命館大学), 井本 桂右 (立命館大学), 小松 達也
- 日本音響学会 2019年秋季研究発表会 (ASJ 2019 autumn)
- 2019.9.4
-
- カンファレンス (国内)
- 国際会議ICASSP2019報告
- 秋田 祐哉*1, 大町 基, 岡本 拓磨*2, 落合 翼*3, 小川 厚徳*3, 神田 直之*4, 郡山 知樹*5, 鈴木 雅之*6, 太刀 岡勇気*7, 俵 直弘*3, 増村 亮*3, 渡部 晋治*8 *1 京大, *2 NICT, *3 NTT, *4 日立, *5 東大, *6 IBM, *7 デンソーアイティーラボラトリ, *8 JHU
- 情報処理学会 第128回音声言語情報処理研究発表会
- 2019.7.12
-
- カンファレンス (国際)
- Multi-channel Itakura Saito Distance Minimization with deep neural network
- Masahito Togami
- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
- 2019.5.12
-
- カンファレンス (国際)
- Simultaneous optimization of forgetting factor and time-frequency mask for Block Online Multi-Channel Speech enhancement
- Masahito Togami
- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
- 2019.5.12
-
- カンファレンス (国際)
- Spatial constraint on multi-channel deep clustering
- Masahito Togami
- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
- 2019.5.12
-
- その他 (国際)
- An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions
- Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Toru Taniguchi, Dung Tran, Yuya Fujita
- arXiv.org
- 2019.4.28