-
- CONFERENCE (INTERNATIONAL)
- Audio Difference Learning for Audio Captioning
- Tatsuya Komatsu, Yusuke Fujita, Kazuya Takeda (Nagoya University), Tomoki Toda (Nagoya University)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- April 14, 2024
-
- CONFERENCE (INTERNATIONAL)
- Cross-Modal Multi-Tasking for Speech-to-Text Translation via Hard Parameter Sharing
- Brian Yan (Carnegie Mellon University), Xuankai Chang (Carnegie Mellon University), Antonios Anastasopoulos (George Mason University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- April 14, 2024
-
- CONFERENCE (INTERNATIONAL)
- Enhancing Multilingual TTS with Voice Conversion Based Data Augmentation and Posterior Embedding
- Hyun-Wook Yoon (NAVER Cloud), Jin-Seob Kim (NAVER Cloud), Ryuichi Yamamoto, Ryo Terashima, Chan-Ho Song (NAVER Cloud), Jae-Min Kim (NAVER Cloud), Eunwoo Song (NAVER Cloud)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- April 14, 2024
-
- CONFERENCE (INTERNATIONAL)
- Keep Decoding Parallel With Effective Knowledge Distillation From Language Models To End-To-End Speech Recognisers
- Michael Hentschel (LINE WORKS Corporation), Yuta Nishikawa (Nara Institute of Science and Technology), Tatsuya Komatsu, Yusuke Fujita
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- April 14, 2024
-
- CONFERENCE (INTERNATIONAL)
- PromptTTS++: Controlling Speaker Identity in Prompt-Based Text-To-Speech Using Natural Language Descriptions
- Reo Shimizu (Tohoku University), Ryuichi Yamamoto, Masaya Kawamura, Yuma Shirahata, Hironori Doi, Tatsuya Komatsu, Kentaro Tachibana
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- April 14, 2024
-
- JOURNAL (DOMESTIC)
- ReflecTouch: 角膜反射像を用いたスマートフォンの把持方法推定
- 池松 香*, 張 翔* (慶應義塾大学), 加藤 邦拓 (東京工科大学), 高柳 直歩 (慶應義塾大学), 杉浦 裕太 (慶應義塾大学), *co-1st authors
- 日本ソフトウエア科学会論文誌 コンピュータ ソフトウェア
- April 01, 2024
-
- CONFERENCE (DOMESTIC)
- 文書への追加情報に対するニューラル検索モデルの挙動分析
- 薄羽 皐太 (筑波大学), 加藤 誠 (筑波大学), 藤田 澄男
- 第16回データ工学と情報マネジメントに関するフォーラム(第22回日本データベース学会年次大会) (DEIM 2024)
- April 01, 2024
-
- CONFERENCE (DOMESTIC)
- 生成型言語モデルによる仮想映画レビューを介した映画検索
- 宮下 天祥 (青学大), 莊司 慶行 (静岡大), 藤田 澄男, 大原 剛三 (青学大)
- 第16回データ工学と情報マネジメントに関するフォーラム(第22回日本データベース学会年次大会) (DEIM 2024)
- April 01, 2024
-
- CONFERENCE (DOMESTIC)
- 追加事前学習によるレビューと商品属性の対応関係学習
- 河田 友香 (兵庫県立大), 山本 岳洋 (兵庫県立大), 大島 裕明 (兵庫県立大), 藤田 澄男
- 第16回データ工学と情報マネジメントに関するフォーラム(第22回日本データベース学会年次大会) (DEIM 2024)
- April 01, 2024
-
- CONFERENCE (DOMESTIC)
- 逆k-MIPSに基づく影響力の大きいアイテムの高速検索
- 青山 和禎 (阪大), 天方 大地 (阪大), 藤田 澄男, 原 隆浩 (阪大)
- 第16回データ工学と情報マネジメントに関するフォーラム(第22回日本データベース学会年次大会) (DEIM 2024)
- April 01, 2024
-
- OTHERS (INTERNATIONAL)
- LV-CTC: Non-autoregressive ASR with CTC and latent variable models
- Yuya Fujita, Shinji Watanabe (Carnegie Mellon Univ.), Xuankai Chang (Carnegie Mellon Univ.), Takashi Maekaku
- arXiv.org (arXiv)
- March 28, 2024
-
- CONFERENCE (INTERNATIONAL)
- Long-term Safe Reinforcement Learning with Binary Feedback
- Akifumi Wachi, Wataru Hashimoto (Osaka University), Kazumune Hashimoto (Osaka University)
- Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)
- March 24, 2024
-
- CONFERENCE (INTERNATIONAL)
- Understanding Likelihood of Normalizing Flow and Image Complexity through the Lens of Out-of-Distribution Detection
- Genki Osada, Tsubasa Takahashi, Takashi Nishide (University of Tsukuba)
- Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24)
- March 24, 2024
-
- CONFERENCE (INTERNATIONAL)
- Exploring Speech Recognition, Translation, and Understanding with Discrete Speech Units: A Comparative Study
- Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Kwanghee Choi (Carnegie Mellon University), Jee-Weon Jung (Carnegie Mellon University), Yichen Lu (Carnegie Mellon University), Soumi Maiti (Carnegie Mellon University), Roshan Sharma (Carnegie Mellon University), Jiatong Shi (Carnegie Mellon University), Jinchuan Tian (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Pengcheng Guo (Northwestern Polytechnical University), Yao-Fei Cheng (University of Washington), Pavel Denisov (University of Stuttgart), Kohei Saijo (Waseda University), Hsiu-Hsuan Wang (National Taiwan University)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- March 20, 2024
-
- CONFERENCE (INTERNATIONAL)
- Hubertopic: Enhancing Semantic Representation of Hubert Through Self-Supervision Utilizing Topic Model
- Takashi Maekaku, Jiatong Shi (Carnegie Mellon University), Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University)
- 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
- March 20, 2024
-
- OTHERS (DOMESTIC)
- GNSS衛星ごとの信号情報に対する点群ニューラルネットワークを用いたUVインデックス推定
- 厚見 昴 (東京大学), 石岡 陸 (東京大学), 坪内 孝太, 西山 勇毅 (東京大学), 瀬崎 薫 (東京大学)
- 情報処理学会ユビキタスコンピューティングシステム研究会 (IPSJ SIGUBI)
- March 19, 2024
-
- OTHERS (DOMESTIC)
- トピックモデルと大規模位置履歴を用いた地域ごとの興味関心分布の分析
- 宮永 薫 (東京工業大学), 安納 爽響 (東京工業大学), 坪内 孝太, 下坂 正倫 (東京工業大学)
- 情報処理学会ユビキタスコンピューティングシステム研究会 (IPSJ SIGUBI)
- March 19, 2024
-
- CONFERENCE (DOMESTIC)
- マイクロブログの再発するトレンドを予測する
- 赤﨑 智, 山下 達雄
- 言語処理学会第30回年次大会 (NLP2024)
- March 12, 2024
-
- CONFERENCE (DOMESTIC)
- 日本語テキストと音楽の対照学習の実験的評価
- 蓮実 拓也, 小松 達也, 藤田 雄介, 二又 航介, 橘 健太郎
- 日本音響学会 2024年春季研究発表会 (ASJ 2024 spring)
- March 07, 2024
-
- OTHERS (INTERNATIONAL)
- Tappy: Predicting Tap Accuracy of User-Interface Elements by Reverse-Engineering Webpage Structures
- Hiroki Usuba, Junichi Sato, Naomi Sasaya, Shota Yamanaka, Fumiya Yamashita
- arXiv.org (arXiv)
- March 06, 2024