-
- カンファレンス (国内)
- Japanese MT-bench++: より自然なマルチターン対話設定における大規模日本語ベンチマーク
- 植松 拓也 (早稲田大学), 福田 創 (早稲田大学), 河原 大輔 (早稲田大学), 柴田 知秀
- NLP若手の会 第19回シンポジウム (YANS2024)
- 2024.9.6
-
- カンファレンス (国際)
- Audio-conditioned phonemic and prosodic annotation for building text-to-speech models from unlabeled speech data
- Yuma Shirahata, Byeongseon Park, Ryuichi Yamamoto, Kentaro Tachibana
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.4
-
- カンファレンス (国内)
- トピックモデルを用いた教師なし学習によるHuBERTの意味表現向上
- 前角 高史, Jiatong Shi (カーネギーメロン大学), Xuankai Chang (カーネギーメロン大学), 藤田 悠哉, 渡部 晋治 (カーネギーメロン大学)
- 日本音響学会 2024年秋季研究発表会 (ASJ 2024 autumn)
- 2024.9.4
-
- カンファレンス (国内)
- 感情音声合成のためのアラインメント手法の比較
- 蓮実 拓也, 白旗 悠真, Welly Naptali, 山本 龍一, Eunwoo Song (NAVER Cloud), 橘 健太郎, Jae-Min Kim (NAVER Cloud)
- 日本音響学会 2024年秋季研究発表会 (ASJ 2024 autumn)
- 2024.9.4
-
- カンファレンス (国内)
- 離散トークン音声認識におけるドメイン適応の検討
- 石井 敬章, 小松 達也, 藤田 雄介, 藤田 悠哉
- 日本音響学会 2024年秋季研究発表会 (ASJ 2024 autumn)
- 2024.9.4
-
- カンファレンス (国際)
- LibriTTS-P: A Corpus with Speaking Style and Speaker Identity Prompts for Text-to-Speech and Style Captioning
- Masaya Kawamura, Ryuichi Yamamoto, Yuma Shirahata, Takuya Hasumi, Kentaro Tachibana
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.3
-
- カンファレンス (国際)
- Song Data Cleansing for End-to-End Neural Singer Diarization Using Neural Analysis and Synthesis Framework
- Hokuto Munakata, Ryo Terashima, Yusuke Fujita
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.3
-
- カンファレンス (国際)
- Audio Fingerprinting with Holographic Reduced Representations
- Yusuke Fujita, Tatsuya Komatsu
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.1
-
- カンファレンス (国際)
- Noise-Robust Voice Conversion by Conditional Denoising Training Using Latent Variables of Recording Quality and Environment
- Takuto Igarashi (The University of Tokyo), Yuki Saito (The University of Tokyo), Kentaro Seki (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Ryuichi Yamamoto, Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo)
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.1
-
- カンファレンス (国際)
- SRC4VC: Smartphone-Recorded Corpus for Voice Conversion Benchmark
- Yuki Saito (The University of Tokyo), Takuto Igarashi (The University of Tokyo), Kentaro Seki (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Ryuichi Yamamoto, Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo)
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.1
-
- カンファレンス (国際)
- Universal Score-based Speech Enhancement with High Content Preservation
- Robin Scheibler, Yusuke Fujita, Yuma Shirahata, Tatsuya Komatsu
- The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH 2024)
- 2024.9.1
-
- 論文誌 (国際)
- MC-Whisper: Extending Speech Foundation Models to Multichannel Distant Speech Recognition
- Xuankai Chang (Carnegie Mellon University), Pengcheng Guo (Northwestern Polytechnical University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University)
- IEEE Signal Processing Letters (IEEE SPL)
- 2024.8.26
-
- カンファレンス (国内)
- Real-SRGD: 分類器無しガイダンスによる実世界超解像向け拡散モデルの画像品質改善
- 土井 賢治, 岡田 俊太郎, 吉橋 亮太, 片岡 裕雄
- 第27回 画像の認識・理解シンポジウム MIRU2024 (MIRU2024)
- 2024.8.9
-
- カンファレンス (国内)
- 拡散モデルを用いた意味領域分割のための擬似マスク生成における教師なしドメイン適応
- 大塚 雄也, 吉橋 亮太, 土井 賢治, 田中 智大
- 第27回 画像の認識・理解シンポジウム MIRU2024 (MIRU2024)
- 2024.8.9
-
- カンファレンス (国内)
- 動画クラスタリングのためのDINOの動画への拡張の検討
- 中嶋 直也, 石川 裕地, 近藤 雅芳
- 第27回 画像の認識・理解シンポジウム MIRU2024 (MIRU2024)
- 2024.8.6
-
- カンファレンス (国際)
- A Survey of Constraint Formulations in Safe Reinforcement Learning
- Akifumi Wachi, Xun Shen (Osaka University), Yanan Sui (Tsinghua University)
- The 33rd International Joint Conference on Artificial Intelligence (IJCAI 2024)
- 2024.8.3
-
- カンファレンス (国内)
- Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model
- 岩井 翔真 (東北大学), 長内 淳樹, 北田 俊輔, 大町 真一郎 (東北大学)
- 第27回 画像の認識・理解シンポジウム MIRU2024 (MIRU2024)
- 2024.7.31
-
- ワークショップ (国際)
- Towards Incorporating Personalized Context for Conversational Information Seeking
- Haitao Yu (Tsukuba univ.), Lingzhen Zheng (Tsukuba univ.), Kaiyu Yang (Tsukuba univ.), Sumio Fujita, Hideo Joho (Tsukuba univ.)
- The 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2024)
- 2024.7.18
-
- カンファレンス (国際)
- Safe Reinforcement Learning Using Model Predictive Control with Probabilistic Control Barrier Function
- Xun Shen (Osaka University), Akifumi Wachi, Wataru Hashimoto (Osaka University), Kazumune Hashimoto (Osaka University), Shigemasa Takai (Osaka University)
- 2024 American Control Conference (ACC 2024)
- 2024.7.10
-
- 論文誌 (国際)
- Enhancing human mobility research with open and standardized datasets
- Takahiro Yabe (New York University), Massimiliano Luca (Fondazione Bruno Kessler), Kota Tsubouchi, Bruno Lepri (Fondazione Bruno Kessler), Marta C. Gonzalez (University of California), Esteban Moro (Northeastern University)
- Nature Computational Science (Nat. Comput. Sci.)
- 2024.7.3