People
藤田 雄介 Yusuke Fujita ソフトウェアエンジニア
2005年に早稲田大学理工学研究科修士課程修了後、日立製作所に入社し、音声合成・音声認識の研究開発およびコー ルセンタや対話ロボットシステムへの応用開発に従事してきました。Johns Hopkins大学客員研究員 (2018-2020) を経て、2021年にLINE (現LINEヤフー ) に入社し、現在、音声認識や音楽情報処理の技術開発をしています。主に、Interspeech, ICASSP, 音響学会などの場で、話者ダイアライゼーション、遠隔音声認識、日本語音声認識についての研究成果を発表しています。早稲田大学招聘研究員。博士(工学)。
Publications
-
- カンファレンス (国内)
- 離散トークン音声認識におけるドメイン適応の検討
- 石井 敬章, 小松 達也, 藤田 雄介, 藤田 悠哉
- 日本音響学会 2024年秋季研究発表会
- 2024.9.4
-
- カンファレンス (国際)
- Song Data Cleansing for End-to-End Neural Singer Diarization Using Neural Analysis and Synthesis Framework
- Hokuto Munakata, Ryo Terashima, Yusuke Fujita
- The 25th Annual Conference of the International Speech Communication Association
- 2024.9.3
-
- カンファレンス (国際)
- Audio Fingerprinting with Holographic Reduced Representations
- Yusuke Fujita, Tatsuya Komatsu
- The 25th Annual Conference of the International Speech Communication Association
- 2024.9.1
-
- カンファレンス (国際)
- Universal Score-based Speech Enhancement with High Content Preservation
- Robin Scheibler, Yusuke Fujita, Yuma Shirahata, Tatsuya Komatsu
- The 25th Annual Conference of the International Speech Communication Association
- 2024.9.1
-
- その他 (国際)
- Song Data Cleansing for End-to-End Neural Singer Diarization Using Neural Analysis and Synthesis Framework
- Hokuto Munakata, Ryo Terashima, Yusuke Fujita
- arXiv.org
- 2024.6.24
-
- カンファレンス (国際)
- Audio Difference Learning for Audio Captioning
- Tatsuya Komatsu, Yusuke Fujita, Kazuya Takeda (Nagoya University), Tomoki Toda (Nagoya University)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2024.4.14
-
- カンファレンス (国際)
- Keep Decoding Parallel With Effective Knowledge Distillation From Language Models To End-To-End Speech Recognisers
- Michael Hentschel (LINE WORKS Corporation), Yuta Nishikawa (Nara Institute of Science and Technology), Tatsuya Komatsu, Yusuke Fujita
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2024.4.14
-
- カンファレンス (国内)
- 日本語テキストと音楽の対照学習の実験的評価
- 蓮実 拓也, 小松 達也, 藤田 雄介, 二又 航介, 橘 健太郎
- 日本音響学会 2024年春季研究発表会
- 2024.3.7
-
- カンファレンス (国内)
- 拡散過程と敵対的学習の併用による普遍音声強調
- シャイブラー ロビン, 藤田 雄介, 橘 健太郎
- 日本音響学会 2024年春季研究発表会
- 2024.3.6
-
- 論文誌 (国際)
- Self-conditioning via Intermediate Predictions for End-to-end Neural Speaker Diarization
- Yusuke Fujita, Tetsuji Ogawa (Waseda University), Tetsunori Kobayashi (Waseda University)
- IEEE Access
- 2023.12.7
-
- カンファレンス (国内)
- End-to-end 音声認識器の中間層への言語知識転移
- Michael Hentschel (WORKS MOBILE JAPAN), 西川 勇太 (奈良先端科学技術大学院大学), 小松 達也, 藤田 雄介
- 日本音響学会 2023年秋季研究発表会
- 2023.9.26
-
- カンファレンス (国内)
- Foley Sound Synthesis with a Class-Conditioned Latent Diffusion Model and FAD-Based Post-filtering
- シャイブラー ロビン, 蓮実 拓也, 藤田 雄介, 小松 達也, 山本 龍一, 橘 健太郎
- 日本音響学会 2023年秋季研究発表会
- 2023.9.26
-
- ワークショップ (国際)
- Foley Sound Synthesis with a Class-conditioned Latent Diffusion Model
- Robin Scheibler, Takuya Hasumi, Yusuke Fujita, Tatsuya Komatsu, Ryuichi Yamamoto, Kentaro Tachibana
- Detection and Classification of Acoustic Scenes and Events
- 2023.9.20
-
- カンファレンス (国際)
- Target Vocabulary Recognition Based on Multi-Task Learning with Decomposed Teacher Sequences
- Aoi Ito (Hosei University), Tatsuya Komatsu, Yusuke Fujita, Yusuke Kida
- The 24th Annual Conference of the International Speech Communication Association
- 2023.8.20
-
- カンファレンス (国際)
- Neural Diarization with Non-Autoregressive Intermediate Attractors
- Yusuke Fujita, Tatsuya Komatsu, Robin Scheibler, Yusuke Kida, Tetsuji Ogawa (Waseda University)
- 2023 IEEE International Conference on Acoustics, Speech and Signal Processing
- 2023.6.4
-
- カンファレンス (国内)
- 中間層予測を用いたEnd-to-end ダイアライゼーション
- 藤田 雄介, 小松 達也, Scheibler Robin, 木田 祐介, 小川 哲司 (早稲田大学)
- 日本音響学会 2023年春季研究発表会
- 2023.3.15
-
- その他 (国内)
- 日本語音声認識における語彙集合分割とマルチタスク学習による 目的語彙抽出
- 伊藤 葵 (LINE/法政大学), 小松 達也, 藤田 雄介
- 電子情報通信学会/日本音響学会 音声研究会
- 2023.2.28
-
- カンファレンス (国際)
- Alternate Intermediate Conditioning with Syllable-level and Character-level Targets for Japanese ASR
- Yusuke Fujita, Tatsuya Komatsu, Yusuke Kida
- The 2022 IEEE Spoken Language Technology Workshop
- 2023.1.9
-
- カンファレンス (国際)
- Inter-Decoder: Using Attention-Decoder losses as Intermediate Regularization for CTC-based Speech Recognition
- Tatsuya Komatsu, Yusuke Fujita
- The 2022 IEEE Spoken Language Technology Workshop
- 2023.1.9
-
- カンファレンス (国際)
- On Sorting and Padding Multiple Targets for Sound Event Localization and Detection with Permutation Invariant and Location-based Training
- Robin Scheibler, Tatsuya Komatsu, Yusuke Fujita, Michael Hentschel
- Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2022
- 2022.11.7