-
- その他 (国際)
- HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model
- Takashi Maekaku, Jiatong Shi (Carnegie Mellon University), Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University)
- arXiv
- 2023.10.9
-
- カンファレンス (国際)
- Acoustic+Pose: Adding Input Modality to Smartphones with Near-Surface Hand-Pose Recognition using Acoustic Surface
- Kunihiro Kato (Tokyo University of Technology), Kaori Ikematsu
- The ACM International Symposium on Wearable Computing (ISWC 2023)
- 2023.10.8
-
- カンファレンス (国際)
- Detecting Thumb-Posture for One-handed Interactions with Smartphone using Acoustic Sensing
- Kunihiro Kato (Tokyo University of Technology), Kaori Ikematsu
- The ACM International Symposium on Wearable Computing (ISWC 2023)
- 2023.10.8
-
- ワークショップ (国際)
- Constructing Image–Text Pair Dataset from Books
- Yamato Okamoto (Naver Cloud Corp. / Works Mobile Japan Corp.), Haruto Toyonaga (Doshisha Univ.), Yoshihisa Ijiri, Hirokatsu Kataoka
- International Conference on Computer Vision workshop on "Towards the Next Generation of Computer Vision Datasets" (ICCVW Datacomp)
- 2023.10.3
-
- ワークショップ (国際)
- Leveraging Image-Text Similarity and Caption Modification for the DataComp Challenge: Filtering Track and BYOD Track
- Shuhei Yokoo, Peifei Zhu, Yuchi Ishikawa, Mikihiro Tanaka, Masayoshi Kondo, Hirokatsu Kataoka
- ICCV 2023 Workshop on Towards the Next Generation of Computer Vision Datasets: DataComp Track (ICCV 2023)
- 2023.10.3
-
- カンファレンス (国際)
- Frequency-aware GAN for Adversarial Manipulation Generation
- Peifei Zhu, Genki Osada, Hirokatsu Kataoka (LINE / AIST), Tsubasa Takahashi
- 2023 International Conference on Computer Vision (ICCV 2023)
- 2023.10.2
-
- カンファレンス (国際)
- Role-aware Interaction Generation from Textual Description
- Mikihiro Tanaka, Kent Fujiwara
- 2023 International Conference on Computer Vision (ICCV 2023)
- 2023.10.2
-
- カンファレンス (国内)
- End-to-end 音声認識器の中間層への言語知識転移
- Michael Hentschel (WORKS MOBILE JAPAN), 西川 勇太 (奈良先端科学技術大学院大学), 小松 達也, 藤田 雄介
- 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)
- 2023.9.26
-
- カンファレンス (国内)
- NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア
- 山本 龍一 (名古屋大学/LINE), 米山 怜於 (名古屋大学), 戸田 智基 (名古屋大学)
- 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)
- 2023.9.26
-
- カンファレンス (国内)
- 独立低ランク行列分析における iterative projection with adjustment を用いた分離行列の更新
- 蓮実 拓也, シャイブラー ロビン
- 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)
- 2023.9.26
-
- カンファレンス (国内)
- Foley Sound Synthesis with a Class-Conditioned Latent Diffusion Model and FAD-Based Post-filtering
- シャイブラー ロビン, 蓮実 拓也, 藤田 雄介, 小松 達也, 山本 龍一, 橘 健太郎
- 日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)
- 2023.9.26
-
- カンファレンス (国内)
- データの分布マッチングによる End-to-End 音声認識モデルのドメイン適応
- 篠原 雄介, 渡部 晋治 (CMU)
- 日本音響学会 第150回(2023年秋季)研究発表会
- 2023.9.26
-
- カンファレンス (国内)
- 潜在変数モデルを用いたCTCによる非自己回帰型音声認識
- 藤田 悠哉, 渡部 晋治 (カーネギーメロン大学)
- 日本音響学会第150回(2023年秋季)研究発表会
- 2023.9.26
-
- 論文誌 (国際)
- Mechanisms to Address Different Privacy Requirements for Users and Locations
- Ryota HIRAISHI (Kyoto univ.), Masatoshi YOSHIKAWA (Kyoto univ.), Yang CAO (Hokkaido univ.), Sumio FUJITA, Hidehito GOMI
- The IEICE Transactions on Information and Systems (IEICE Transactions)
- 2023.9.25
-
- ワークショップ (国際)
- Foley Sound Synthesis with a Class-conditioned Latent Diffusion Model
- Robin Scheibler, Takuya Hasumi, Yusuke Fujita, Tatsuya Komatsu, Ryuichi Yamamoto, Kentaro Tachibana
- Detection and Classification of Acoustic Scenes and Events (DCASE 2023)
- 2023.9.20
-
- カンファレンス (国際)
- Single-tap Latency Reduction with Single- or Double- tap Prediction
- Naoto Nishida* (The University of Tokyo) , Kaori Ikematsu*, Junichi Sato, Shota Yamanaka, Kota Tsubouchi, *co-first authors
- The ACM International Conference on Mobile Human-Computer Interaction (MobileHCI2023)
- 2023.9.13
-
- カンファレンス (国際)
- An Open-Domain Avatar Chatbot by Exploiting a Large Language Model
- Takato Yamazaki, Tomoya Mizumoto, Katsumasa Yoshikawa, Masaya Ohagi, Toshiki Kawamoto (LINE/Tokyo Institute of Technology), Toshinori Sato
- 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL 2023)
- 2023.9.11
-
- カンファレンス (国際)
- Bridging the Gap between Subword and Character Segmentation in Pretrained Language Models
- Shun Kiyono, Sho Takase, Shengzhe Li, Toshinori Sato
- Recent Advances in Natural Language Processing (RANLP 2023)
- 2023.9.4
-
- カンファレンス (国際)
- On Text Localization in End-to-End OCR-Free Document Understanding Transformer without Text Localization Supervision
- Geewook Kim (NAVER Cloud), Shuhei Yokoo, Sukmin Seo (NAVER Cloud), Atsuki Osanai, Yamato Okamoto, Youngmin Baek (NAVER Cloud)
- 10th International Workshop on Camera-Based Document Analysis and Recognition (CBDAR2023)
- 2023.8.25
-
- 論文誌 (国際)
- Building a hospitable and reliable dialogue system for android robots: a scenario-based approach with large language models
- Takato Yamazaki, Katsumasa Yoshikawa, Toshiki Kawamoto (LINE/Tokyo Institute of Technology), Tomoya Mizumoto, Masaya Ohagi, Toshinori Sato
- Advanced Robotics (Advanced Robotics)
- 2023.8.22