LINEヤフーの研究開発

JP
EN

Publications

音声処理

その他 (国際)

End-to-End ASR and Audio Segmentation with Non-autoregressive Insertion-based model

Yuya Fujita, Shinji Watanabe (Johns Hopkins Univ.), Motoi Omachi

arXiv.org

2020.12.18
カンファレンス (国際)

A Study on More Realistic Room Simulation for Far-Field Keyword Spotting

Eric Bezzam (EPFL/Sonos), Robin Scheibler, Cyril Cadoux (EPFL), Thibault Gisselbrecht (Sonos)

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2020 (APSIPA 2020)

2020.12.7
カンファレンス (国際)

Computer-Resource-Aware Deep Speech Separation with a Run-Time-Specified Number of BLSTM Layers

Masahito Togami, Yoshiki Masuyama (Waseda University), Tatsuya Komatsu, Kazuyoshi Yoshii (Kyoto University), Tatsuya Kawahara (Kyoto University)

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2020 (APSIPA ASC 2020)

2020.12.7
カンファレンス (国際)

Integration of Semi-Blind Speech Source Separation and Voice Activity Detection for Flexible Spoken Dialogue

Masaya Wake (Kyoto University), Masahito Togami, Kazuyoshi Yoshii (Kyoto University), Tatsuya Kawahara (Kyoto University)

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2020 (APSIPA ASC 2020)

2020.12.7
カンファレンス (国際)

Over-determined Speech Source Separation and Dereverberation

Masahito Togami, Robin Scheibler

Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2020 (APSIPA ASC 2020)

2020.12.7
論文誌 (国際)

Innovation, Standardization, and Business Success in Media Signal Processing

Akihiko Sugiyama and Masahiro Serizawa (NEC Corporation)

Institute of Electrical and Electronics Engineers, Consumer Electronics Magazine (MCE)

2020.11.3
ワークショップ (国際)

Conformer-based sound event detection with semi-supervised learning and data augmentation

Koichi Miyazaki (Nagoya University), Tatsuya Komatsu, Tomoki Hayashi (Human Dataware Lab), Shinji Watanabe (Johns Hopkins University), Tomoki Toda (Nagoya University), Kazuya Takeda (Nagoya University)

Detection and Classification of Acoustic Scenes and Events (DCASE 2020)

2020.11.2
カンファレンス (国際)

End-to-End ASR with Adaptive Span Self-Attention

Xuankai Chang (Johns Hopkins University), Aswin Shanmugam Subramanian (Johns Hopkins University), Pengcheng Guo (Northwestern Polytechnical University, Johns Hopkins University), Shinji Watanabe (Johns Hopkins University), Yuya Fujita, Motoi Omachi

INTERSPEECH 2020

2020.10.25
カンファレンス (国際)

Generalized Minimal Distortion Principle for Blind Source Separation

Robin Scheibler

The 21st Annual Conference of the International Speech Communication Association (INTERSPEECH 2020)

2020.10.25
カンファレンス (国際)

Insertion-Based Modeling for End-to-End Automatic Speech Recognition

Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)

INTERSPEECH 2020

2020.10.25
カンファレンス (国際)

Mentoring-Reverse Mentoring for Unsupervised Multi-channel Speech Source Separation

Yu Nakagome (Waseda University), Masahito Togami, Tetsuji Ogawa (Waseda University), Tetsunori Kobayashi (Waseda University)

The 21st Annual Conference of the International Speech Communication Association (INTERSPEECH 2020)

2020.10.25
カンファレンス (国際)

Neural Text-to-Speech with a Modeling-by-Generation Excitation Vocoder

Eunwoo Song (NAVER), Min-Jae Hwang (Search Solutions Inc.), Ryuichi Yamamoto, Jin-Seob Kim (NAVER), Ohsung Kwon (NAVER), Jae-Min Kim (NAVER)

The 21st Annual Conference of the International Speech Communication Association (INTERSPEECH 2020)

2020.10.25
カンファレンス (国際)

Sparseness-Aware DOA Estimation with Majorization Minimization

Masahito Togami, Robin Scheibler

The 21st Annual Conference of the International Speech Communication Association (INTERSPEECH 2020)

2020.10.25
カンファレンス (国内)

単語の表記と素性を同時出力するend-to-end音声認識

大町基, 藤田悠哉, 渡部晋治 (Johns Hopkins University), Xuankai Chang (Johns Hopkins University)

日本音響学会2020年秋季研究発表会 (音響学会)

2020.9.11
カンファレンス (国内)

A Generalized Minimal Distortion Principle to Solve the Scale Ambiguity in Blind Source Separation

シャイブラーロビン

日本音響学会 2020年秋季研究発表会 (ASJ 2020 autumn)

2020.9.9
カンファレンス (国内)

Mentoring-Reverse Mentoring：多チャンネル音源分離における教師なし学習のための知識伝搬フレームワーク

中込優 (早稲田大学), 戸上真人, 小川哲司 (早稲田大学), 小林哲則 (早稲田大学)

日本音響学会 2020年秋季研究発表会 (ASJ 2020 autumn)

2020.9.9
カンファレンス (国内)

挿入操作に基づく End-to-End 音声認識

藤田悠哉, 渡部晋治 (Johns Hopkins Univ.), 大町基, Xuankai Chang (Johns Hopkins Univ.)

日本音響学会2020年秋季研究発表会 (音響学会)

2020.9.9
その他 (国際)

Insertion-Based Modeling for End-to-End Automatic Speech Recognition

Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Motoi Omachi, Xuankai Chang (Johns Hopkins University)

arXiv.org

2020.5.27
カンファレンス (国際)

Attention-based ASR with Lightweight and Dynamic Convolutions

Yuya Fujita, Aswin Shanmugam Subramanian (Johns Hopkins University), Motoi Omachi, Shinji Watanabe (Johns Hopkins University)

45th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020)

2020.5.8
カンファレンス (国際)

Consistency-Aware Multi-Channel Speech Enhancement Using Deep Neural Networks

Yoshiki Masuyama (Waseda University), Masahito Togami, Tatsuya Komatsu

2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2020)

2020.5.4

前へ

前のページ

1
…
9
10
11
…
13

次のページ

次へ