LY Corporation R&D

JP
EN

Publications

Speech Processing

OTHERS (INTERNATIONAL)

Streaming End-to-End ASR based on Blockwise Non-Autoregressive Models

Tianzi Wang (Johns Hopkins Univ.), Yuya Fujita, Xuankai Chang (Carnegie Mellon Univ.), Shinji Watanabe (Carnegie Mellon Univ.)

arXiv.org

July 20, 2021
OTHERS (INTERNATIONAL)

Toward Streaming ASR with Non-Autoregressive Insertion-based Model

Yuya Fujita, Tianzi Wang (Johns Hopkins Univ.), Shinji Watanabe (Carnegie Mellon Univ.), Motoi Omachi

arXiv.org

July 16, 2021
WORKSHOP (INTERNATIONAL)

Improved Parallel WaveGAN with perceptually weighted spectrogram loss

Eunwoo Song (NAVER), Ryuichi Yamamoto, Min-Jae Hwang (NAVER), Jin-Seob Kim (NAVER), Ohsung Kwon (NAVER), Jae-Min Kim (NAVER)

2021 IEEE Spoken Language Technology Workshop (SLT) (SLT 2021)

June 19, 2021
CONFERENCE (INTERNATIONAL)

Disentangled Speaker and Language Representations Using Mutual Information Minimization and Domain Adaptation for Cross-Lingual TTS

Detai Xin (The University of Tokyo), Tatsuya Komatsu, Shinnosuke Takamichi (The University of Tokyo), Hiroshi Saruwatari (The University of Tokyo)

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

End To End Learning For Convolutive Multi-Channel Wiener Filtering

Masahito Togami

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

End-to-end ASR to jointly predict transcriptions and linguistic annotations

Motoi Omachi, Yuya Fujita, Shinji Watanabe (Johns Hopkins University), Matthew Wiesner (Johns Hopkins University)

The 2021　North American Chapter of the Association for Computational Linguistics : Human Language Technologies (NAACL-HLT2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

Joint Dereverberation and Separation With Iterative Source Steering

Taishi Nakashima (Tokyo Metropolitan University), Robin Scheilbler, Masahito Togami, Nobutaka Ono (Tokyo Metropolitan University)

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

Parallel Waveform Synthesis Based on Generative Adversarial Networks with Voicing-Aware Conditional Discriminators

Ryuichi Yamamoto, Eunwoo Song (NAVER), Min-Jae Hwang (Search Solutions Inc), Jae-Min Kim (NAVER)

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

Refinement of Direction of Arrival Estimators by Majorization-Minimization Optimization on the Array Manifold

Robin Scheilbler, Masahito Togami

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

Surrogate Source Model Learning for Determined Source Separation

Robin Scheilbler, Masahito Togami

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
CONFERENCE (INTERNATIONAL)

TTS-by-TTS: TTS-Driven Data Augmentation for Fast and High-Quality Speech Synthesis

Min-Jae Hwang (Search Solutions Inc), Ryuichi Yamamoto, Eunwoo Song (NAVER), Jae-Min Kim (NAVER)

2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2021)

June 06, 2021
JOURNAL (INTERNATIONAL)

Independent Vector Analysis via Log-Quadratically Penalized Quadratic Minimization

Robin Scheibler

IEEE Transactions on Signal Processing (IEEE TSP)

April 09, 2021
CONFERENCE (DOMESTIC)

Attention モデルのTeacher-Forcing を用いた長時間音声とテキストの自動アライメント

木田祐介, 小松達也, 戸上真人

日本音響学会 2021年春季研究発表会 (ASJ 2021 spring)

March 10, 2021
CONFERENCE (DOMESTIC)

ドメイン適応と相互情報量最小化によるdisentangled な話者・言語表現に基づいたクロスリンガル音声合成

辛徳泰 (東京都大学), 小松達也, 高道慎之介 (東京都大学), 猿渡洋 (東京都大学)

日本音響学会 2021年春季研究発表会 (ASJ 2021 spring)

March 10, 2021
CONFERENCE (DOMESTIC)

ペアデータを必要としない敵対的学習に基づく多チャンネル音源分離

中込優 (早稲田大学), 戸上真人, 小川哲司 (早稲田大学), 小林哲則 (早稲田大学)

日本音響学会 2021年春季研究発表会 (ASJ 2021 spring)

March 10, 2021
CONFERENCE (DOMESTIC)

挿入操作に基づく End-to-End モデルによる音声認識と音声区間検出

藤田悠哉, 渡部晋治 (Johns Hopkins Univ.), 大町基

日本音響学会2021年春季研究発表会

March 10, 2021
CONFERENCE (INTERNATIONAL)

Deep Multi-channel Speech Source Separation with Time-frequency Masking for Spatially Filtered Microphone Input Signal

Masahito Togami

28th European Signal Processing Conference (EUSIPCO 2020)

January 18, 2021
CONFERENCE (INTERNATIONAL)

Robust Acoustic Scene Classification to Multiple Devices Using Maximum Classifier Discrepancy and Knowledge Distillation

Saori Takeyama (Tokyo Institute of Technology), Tatsuya Komatsu, Koichi Miyazaki (Nagoya University), Masahito Togami, Shunsuke Ono (Tokyo Institute of Technology)

28th European Signal Processing Conference (EUSIPCO 2020)

January 18, 2021
CONFERENCE (INTERNATIONAL)

Sound Event Localization and Detection using a Recurrent Convolutional Neural Network and Gated Linear Unit

Tatsuya Komatsu, Masahito Togami, Tsubasa Takahashi

28th European Signal Processing Conference (EUSIPCO 2020)

January 18, 2021
WORKSHOP (INTERNATIONAL)

Disentangling Clustered Representations of Variational Autoencoders for Generating Diverse Samples

Tsubasa Takahashi, Tatsuya Komatsu, Koki Yamada (Tokyo University of Agriculture and Technology)

Learning Data Representation for Clustering (LDRC at IJCAI 2020)

January 07, 2021

prev

prev

1
…
8
9
10
…
13

next

next