LINEヤフーの研究開発

JP
EN

Publications

音声処理

ワークショップ (国際)

Generalized Weighted-Prediction-Error Dereverberation with Varying Source Priors for Reverberant Speech Recognition

Toru Taniguchi, Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Dung Tran, Yuya Fujita, and Shinji Watanabe(Johns Hopkins Univ.)

2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)

2019.10.20
ワークショップ (国際)

Speech Enhancement Using End-to-End Speech Recognition Objectives

Aswin Shanmugam Subramanian(Johns Hopkins University), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Murali Karthick Baskar (Johns Hopkins Univ., Brno University of Technology), Toru Taniguchi, Dung Tran, and Yuya Fujita

2019 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2019)

2019.10.20
カンファレンス (国際)

Simultaneous Detection and Localization of a Wake-Up Word using Multi-Task Learning of the Duration and Endpoint

Takashi Maekaku, Yusuke Kida, Akihiko Sugiyama

The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)

2019.9.19
カンファレンス (国際)

Multichannel Loss Function for Supervised Speech Source Separation by Mask-based Beamforming

Yoshiki Masuyama (Waseda University), Masahito Togami, Tatsuya Komatsu

The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)

2019.9.15
カンファレンス (国際)

Probability Density Distillation with Generative Adversarial Networks for High-Quality Parallel Waveform Generation

Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)

The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)

2019.9.15
カンファレンス (国際)

Variational Bayesian Multi-channel Speech Dereverberation under Noisy Environments with Probabilistic Convolutive Transfer Function

Masahito Togami, Tatsuya Komatsu

The 20th Annual Conference of the International Speech Communication Association (INTERSPEECH 2019)

2019.9.15
カンファレンス (国内)

多様な環境音の合成と変換のための基礎検討

岡本悠希 (立命館大学), 柳生拓巳 (立命館大学), 井本桂右 (立命館大学), 小松達也

日本音響学会 2019年秋季研究発表会 (ASJ 2019 autumn)

2019.9.4
カンファレンス (国内)

国際会議ICASSP2019報告

秋田祐哉*1, 大町基, 岡本拓磨*2, 落合翼*3, 小川厚徳*3, 神田直之*4, 郡山知樹*5, 鈴木雅之*6, 太刀岡勇気*7, 俵直弘*3, 増村亮*3, 渡部晋治*8 *1 京大, *2 NICT, *3 NTT, *4 日立, *5 東大, *6 IBM, *7 デンソーアイティーラボラトリ, *8 JHU

情報処理学会第128回音声言語情報処理研究発表会

2019.7.12
カンファレンス (国際)

Multi-channel Itakura Saito Distance Minimization with deep neural network

Masahito Togami

2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)

2019.5.12
カンファレンス (国際)

Simultaneous optimization of forgetting factor and time-frequency mask for Block Online Multi-Channel Speech enhancement

Masahito Togami

2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)

2019.5.12
カンファレンス (国際)

Spatial constraint on multi-channel deep clustering

Masahito Togami

2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)

2019.5.12
その他 (国際)

An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions

Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Toru Taniguchi, Dung Tran, Yuya Fujita

arXiv.org

2019.4.28
論文誌 (国内)

Web検索等に利用される分散型音声認識システムへのディープラーニングの実装

藤田悠哉

情報処理学会デジタルプラクティス Vol.10 No.2(Apr. 2019)

2019.4.15
カンファレンス (国内)

ニューラルネットワークによる音源方向推定に基づく目的音源抽出のための適応ビームフォーマ

中込優 (早稲田大学), 戸上真人

日本音響学会 2019年春季研究発表会 (ASJ 2019 spring)

2019.3.5
カンファレンス (国内)

Model Averaging法を用いた音声認識のためのマルチGPU学習の高速化

吉澤風希（東大）, 磯健一

日本音響学会2019年春季研究発表会

2019.3.5
カンファレンス (国内)

始端からの経過時間を同時推定するキーワード検出法の提案

前角高史, 木田祐介

日本音響学会2019年春季研究発表会

2019.3.5
ワークショップ (国際)

Speaker Selective Beamformer with Keyword Mask Estimation

Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, and Yuya Fujita

2018 IEEE Workshop on Spoken Language Technology (SLT 2018　)

2018.12.18
論文誌 (国際)

Speaker Selective Beamformer with Keyword Mask Estimation

Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, Yuya Fujita

arXiv.org

2018.10.26
カンファレンス (国内)

Wakeupワードに特化したDNNマスクを用いた背景発話に頑健な音声認識

木田祐介, Dung Tran, 大町基, 谷口徹, 藤田悠哉

日本音響学会2018年秋季研究発表会

2018.9.12
その他 (国内)

音声発話からの意味理解

颯々野学

電子情報通信学会 vol.101 No.9

2018.9.1

前へ

前のページ

1
…
11
12
13

次のページ

次へ