Takashi Maekaku - LY Corporation R&D

CONFERENCE (INTERNATIONAL)
Online Register For Dual-Mode Self-Supervised Speech Models: Mitigating the Lack of Future Context: Keita Goto, Takashi Maekaku, Jin Sakuma, Jinchuan Tian (Carnegie Mellon University), Yusuke Shinohara, Shinji Watanabe (Carnegie Mellon University); 2026 IEEE International Conference on Acoustics, Speech and Signal Processing; May 04, 2026

Speech Processing

CONFERENCE (DOMESTIC)
テキストベースの大規模言語モデルを用いた音声事前学習モデルの評価: 前角高史, 後藤啓太, Jinchuan Tian (カーネギーメロン大学), 篠原雄介, 渡部晋治 (カーネギーメロン大学); 日本音響学会 2026年春季研究発表会; March 17, 2026

Speech Processing

OTHERS (INTERNATIONAL)
Online Register for Dual-Mode Self-Supervised Speech Models: Mitigating The Lack of Future Context: Keita Goto, Takashi Maekaku, Jin Sakuma, Jinchuan Tian (Carnegie Mellon University), Yusuke Shinohara, Shinji Watanabe (Carnegie Mellon University); arXiv.org; March 02, 2026

Speech Processing

OTHERS (INTERNATIONAL)
Bagpiper: Solving Open-Ended Audio Tasks via Rich Captions: Jinchuan Tian (Carnegie Mellon University), Haoran Wang (Carnegie Mellon University), Bo-Hao Su (Carnegie Mellon University), Chien-Yu Huang (Carnegie Mellon University), Qingzheng Wang (Carnegie Mellon University), Jiatong Shi (Carnegie Mellon University), William Chen (Carnegie Mellon University), Xun Gong (Carnegie Mellon University), Siddhant Arora (Carnegie Mellon University), Chin-Jou Li (Carnegie Mellon University), Masao Someki (Carnegie Mellon University), Takashi Maekaku, Keita Goto, Yusuke Shinohara, Jin Sakuma, Chao-Han Huck Yang (NVIDIA Research), Shinji Watanabe (Carnegie Mellon University); arXiv.org; February 06, 2026

Speech Processing

WORKSHOP (INTERNATIONAL)
Evaluating Self-Supervised Speech Models Via Text-Based LLMs: Takashi Maekaku, Keita Goto, Jinchuan Tian (Carnegie Mellon University), Yusuke Shinohara, Shinji Watanabe (Carnegie Mellon University); 2025 IEEE Automatic Speech Recognition and Understanding Workshop; December 08, 2025

Speech Processing

OTHERS (INTERNATIONAL)
Evaluating Self-Supervised Speech Models via Text-Based LLMS: Takashi Maekaku, Keita Goto, Jinchuan Tian (Carnegie Mellon University), Yusuke Shinohara, Shinji Watanabe (Carnegie Mellon University); arXiv.org; October 07, 2025

Speech Processing

CONFERENCE (DOMESTIC)
トピックモデルを用いた教師なし学習によるHuBERTの意味表現向上: 前角高史, Jiatong Shi (カーネギーメロン大学), Xuankai Chang (カーネギーメロン大学), 藤田悠哉, 渡部晋治 (カーネギーメロン大学); 日本音響学会 2024年秋季研究発表会; September 04, 2024

Speech Processing

JOURNAL (INTERNATIONAL)
MC-Whisper: Extending Speech Foundation Models to Multichannel Distant Speech Recognition: Xuankai Chang (Carnegie Mellon University), Pengcheng Guo (Northwestern Polytechnical University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University); IEEE Signal Processing Letters; August 26, 2024

Speech Processing

OTHERS (INTERNATIONAL)
LV-CTC: Non-autoregressive ASR with CTC and latent variable models: Yuya Fujita, Shinji Watanabe (Carnegie Mellon Univ.), Xuankai Chang (Carnegie Mellon Univ.), Takashi Maekaku; arXiv.org; March 28, 2024

Speech Processing

CONFERENCE (INTERNATIONAL)
Exploring Speech Recognition, Translation, and Understanding with Discrete Speech Units: A Comparative Study: Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Kwanghee Choi (Carnegie Mellon University), Jee-Weon Jung (Carnegie Mellon University), Yichen Lu (Carnegie Mellon University), Soumi Maiti (Carnegie Mellon University), Roshan Sharma (Carnegie Mellon University), Jiatong Shi (Carnegie Mellon University), Jinchuan Tian (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Pengcheng Guo (Northwestern Polytechnical University), Yao-Fei Cheng (University of Washington), Pavel Denisov (University of Stuttgart), Kohei Saijo (Waseda University), Hsiu-Hsuan Wang (National Taiwan University); 2024 IEEE International Conference on Acoustics, Speech and Signal Processing; March 20, 2024

Speech Processing

CONFERENCE (INTERNATIONAL)
Hubertopic: Enhancing Semantic Representation of Hubert Through Self-Supervision Utilizing Topic Model: Takashi Maekaku, Jiatong Shi (Carnegie Mellon University), Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); 2024 IEEE International Conference on Acoustics, Speech and Signal Processing; March 20, 2024

Speech Processing

CONFERENCE (INTERNATIONAL)
LV-CTC: Non-autoregressive ASR with CTC and Latent Variable Models: Yuya Fujita, Shinji Watanabe (Carnegie Mellon Univ.), Xuankai Chang (Carnegie Mellon Univ.), Takashi Maekaku; The 2023 IEEE Workshop on Automatic Speech Recognition and Understanding; December 16, 2023

Speech Processing

OTHERS (INTERNATIONAL)
HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model: Takashi Maekaku, Jiatong Shi (Carnegie Mellon University), Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); arXiv; October 09, 2023

Speech Processing

CONFERENCE (INTERNATIONAL)
Exploration of Efficient End-to-End ASR using Discretized Input from Self-Supervised Learning: Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University); The 24th Annual Conference of the International Speech Communication Association; August 20, 2023

Speech Processing

CONFERENCE (INTERNATIONAL)
Fully Unsupervised Topic Clustering of Unlabelled Spoken Audio Using Self-Supervised Representation Learning and Topic Model: Takashi Maekaku, Yuya Fujita, Xuankai Chang (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University); The International Conference on Acoustics, Speech, & Signal Processing 2023; June 07, 2023

Speech Processing

OTHERS (INTERNATIONAL)
Exploration of Efficient End-to-End ASR using Discretized Input from Self-Supervised Learning: Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University); arXiv; May 29, 2023

Speech Processing

CONFERENCE (DOMESTIC)
Transformerを用いた音声認識モデルにおける事前分布を用いた注意重みの平滑化の検討: 前角高史, 藤田悠哉, Yifang Peng (Carnegie Mellon University), 渡部晋治 (Carnegie Mellon University); 日本音響学会2023年春季研究発表会; March 16, 2023

Speech Processing

CONFERENCE (INTERNATIONAL)
Attention Weight Smoothing Using Prior Distributions for Transformer-Based End-to-End ASR: Takashi Maekaku, Yuya Fujita, Yifan Peng (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University); The 23rd Annual Conference of the International Speech Communication Association; September 19, 2022

Speech Processing

CONFERENCE (INTERNATIONAL)
End-to-End Integration of Speech Recognition, Speech Enhancement, and Self-Supervised Learning Representation: Xuankai Chang (Carnegie Mellon University), Takashi Maekaku, Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); The 23rd Annual Conference of the International Speech Communication Association; September 19, 2022

Speech Processing

CONFERENCE (INTERNATIONAL)
An Exploration of Hubert with Large Number of Cluster Units and Model Assessment Using Bayesian Information Criterion: Takashi Maekaku, Xuankai Chang (Carnegie Mellon University), Yuya Fujita, Shinji Watanabe (Carnegie Mellon University); The International Conference on Acoustics, Speech, & Signal Processing 2022; May 10, 2022

Speech Processing

LY Corporation R&D

People

Takashi Maekaku Software Engineer

Publications