音声処理
-
- カンファレンス (国際)
- Simultaneous optimization of forgetting factor and time-frequency mask for Block Online Multi-Channel Speech enhancement
- Masahito Togami
- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
- 2019.5.12
-
- カンファレンス (国際)
- Spatial constraint on multi-channel deep clustering
- Masahito Togami
- 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019)
- 2019.5.12
-
- その他 (国際)
- An Investigation of End-to-End Multichannel Speech Recognition for Reverberant and Mismatch Conditions
- Aswin Shanmugam Subramanian (Johns Hopkins Univ.), Xiaofei Wang (Johns Hopkins Univ.), Shinji Watanabe (Johns Hopkins Univ.), Toru Taniguchi, Dung Tran, Yuya Fujita
- arXiv.org
- 2019.4.28
-
- 論文誌 (国内)
- Web検索等に利用される分散型音声認識システムへのディープラーニングの実装
- 藤田 悠哉
- 情報処理学会 デジタルプラクティス Vol.10 No.2(Apr. 2019)
- 2019.4.15
-
- カンファレンス (国内)
- ニューラルネットワークによる音源方向推定に基づく目的音源抽出のための適応ビームフォーマ
- 中込 優 (早稲田大学), 戸上 真人
- 日本音響学会 2019年春季研究発表会 (ASJ 2019 spring)
- 2019.3.5
-
- カンファレンス (国内)
- Model Averaging法を用いた音声認識のためのマルチGPU学習の高速化
- 吉澤 風希(東大), 磯 健一
- 日本音響学会2019年春季研究発表会
- 2019.3.5
-
- カンファレンス (国内)
- 始端からの経過時間を同時推定するキーワード検出法の提案
- 前角 高史, 木田 祐介
- 日本音響学会2019年春季研究発表会
- 2019.3.5
-
- ワークショップ (国際)
- Speaker Selective Beamformer with Keyword Mask Estimation
- Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, and Yuya Fujita
- 2018 IEEE Workshop on Spoken Language Technology (SLT 2018 )
- 2018.12.18
-
- 論文誌 (国際)
- Speaker Selective Beamformer with Keyword Mask Estimation
- Yusuke Kida, Dung Tran, Motoi Omachi, Toru Taniguchi, Yuya Fujita
- arXiv.org
- 2018.10.26
-
- カンファレンス (国内)
- Wakeupワードに特化したDNNマスクを用いた背景発話に頑健な音声認識
- 木田 祐介, Dung Tran, 大町 基, 谷口 徹, 藤田 悠哉
- 日本音響学会2018年秋季研究発表会
- 2018.9.12
-
- その他 (国内)
- 音声発話からの意味理解
- 颯々野 学
- 電子情報通信学会 vol.101 No.9
- 2018.9.1
-
- カンファレンス (国際)
- Multi Scale Feedback Connection for Noise Robust Acoustic Modeling
- Dung Tran, Ken-ichi Iso, Motoi Omachi, Yuya Fujita
- 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (IEEE ICASSP 2018)
- 2018.4.15
-
- ワークショップ (国内)
- LSTMを用いたキーワードスポッティング
- 増田 嵩志(東大), 張 豪逸(東京工業大), 磯 健一
- 日本音響学会2017年春季研究発表会
- 2017.3.15
-
- 論文誌 (国内)
- 音声認識におけるDeep Learningの活用
- 磯 健一
- 日本神経回路学会
- 2017.3.5
-
- カンファレンス (国際)
- Robust DNN-based VAD augmented with phone entropy based rejection of background speech
- Yuya Fujita, Ken-ichi Iso
- The 17th Annual Conference of the International Speech Communication Association (InterSpeech 2016)
- 2016.9.8
-
- ワークショップ (国内)
- 音素エントロピーを利用した背景発話に頑健なDNNに基づく音声区間検出
- 藤田 悠哉, 磯 健一
- 情報処理学会 第112回音声言語情報処理研究発表会
- 2016.7.21
-
- ワークショップ (国内)
- 一覧性と再確認性の向上による作業の効率化にむけた動画広告の審査支援システム
- 田邉 昭博, 山下 直晃, 野口 正樹, 酒井 正也, 坂本 竜基
- 情報処理学会 研究報告グループウェアとネットワークサービス
- 2015.9.25
-
- ワークショップ (国際)
- Speaker Adaptation of Deep Neural Networks Using a Hierarchy of Output Layers
- Ryan Price(Tokyo Institute of Technology), Ken-ichi Iso, Koichi Shinoda(Tokyo Institute of Technology)
- 2014 Spoken Language Technology Workshop, IEEE
- 2014.12.8
-
- ワークショップ (国内)
- 「音声アシスト」の音声認識と自然言語処理の開発
- 磯 健一, 颯々野 学
- 情報処理学会 第98回音声言語情報処理情報学研究発表会 (IPSJSIG)
- 2013.1.1
-
- カンファレンス (国際)
- Improvements in Japanese Voice Search
- Ken-ichi Iso, Edward Whittaker(Inferret Ltd.), Tadashi Emori, Jumpei Miyake
- Annual Conference of the International Speech Communication Association (InterSpeech 2012)
- 2012.9.1