LINEヤフーの研究開発

JP
EN

Publications

音声処理

カンファレンス (国内)

NNSVS: ニューラルネットワークに基づく歌声合成のためのオープンソースソフトウェア

山本龍一 (名古屋大学/LINE), 米山怜於 (名古屋大学), 戸田智基 (名古屋大学)

日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)

2023.9.26
カンファレンス (国内)

独立低ランク行列分析における iterative projection with adjustment を用いた分離行列の更新

蓮実拓也, シャイブラーロビン

日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)

2023.9.26
カンファレンス (国内)

Foley Sound Synthesis with a Class-Conditioned Latent Diffusion Model and FAD-Based Post-filtering

シャイブラーロビン, 蓮実拓也, 藤田雄介, 小松達也, 山本龍一, 橘健太郎

日本音響学会 2023年秋季研究発表会 (ASJ 2023 autumn)

2023.9.26
カンファレンス (国内)

データの分布マッチングによる End-to-End 音声認識モデルのドメイン適応

篠原雄介, 渡部晋治 (CMU)

日本音響学会第150回（2023年秋季）研究発表会

2023.9.26
カンファレンス (国内)

潜在変数モデルを用いたCTCによる非自己回帰型音声認識

藤田悠哉, 渡部晋治 (カーネギーメロン大学)

日本音響学会第150回(2023年秋季)研究発表会

2023.9.26
ワークショップ (国際)

Foley Sound Synthesis with a Class-conditioned Latent Diffusion Model

Robin Scheibler, Takuya Hasumi, Yusuke Fujita, Tatsuya Komatsu, Ryuichi Yamamoto, Kentaro Tachibana

Detection and Classification of Acoustic Scenes and Events (DCASE 2023)

2023.9.20
カンファレンス (国際)

CALLS: Japanese Empathetic Dialogue Speech Corpus of Complaint Handling and Attentive Listening in Customer Center

Yuki Saito (The University of Tokyo), Eiji Iimori (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo)

The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023)

2023.8.20
カンファレンス (国際)

ChatGPT-EDSS: Empathetic Dialogue Speech Synthesis Trained from ChatGPT-derived Context Word Embeddings

Yuki Saito (The University of Tokyo), Shinnosuke Takamichi (The University of Tokyo), Eiji Iimori (The University of Tokyo), Kentaro Tachibana, Hiroshi Saruwatari (The University of Tokyo)

The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023)

2023.8.20
カンファレンス (国際)

Exploration of Efficient End-to-End ASR using Discretized Input from Self-Supervised Learning

Xuankai Chang (Carnegie Mellon University), Brian Yan (Carnegie Mellon University), Yuya Fujita, Takashi Maekaku, Shinji Watanabe (Carnegie Mellon University)

The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023)

2023.8.20
カンファレンス (国際)

Multi-channel separation of dynamic speech and sound events

Takuya Fujimura (Nagoya University), Robin Scheibler

The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023)

2023.8.20
カンファレンス (国際)

Target Vocabulary Recognition Based on Multi-Task Learning with Decomposed Teacher Sequences

Aoi Ito (Hosei University), Tatsuya Komatsu, Yusuke Fujita, Yusuke Kida

The 24th Annual Conference of the International Speech Communication Association (INTERSPEECH 2023)

2023.8.20
論文誌 (国際)

Audio Signal Processing in the 21st Century

Gaël Richard (Telecom-Paris), Paris Smaragdis (University of Illinois Urbana-Champaign), Sharon Gannot (Bar-Ilan University), Patrick A. Naylor (Imperial College London), Shoji Makino (Waseda University), Walter Kellermann (University of Erlangen-N ̈urnberg), Akihiko Sugiyama

IEEE Signal Processing Magazine (Signal Processing Magazine)

2023.7.19
ワークショップ (国内)

ChatGPT-EDSS: ChatGPT由来のContext Word Embeddingから学習される共感的対話音声合成モデル

齋藤佑樹 (東京大学), 高道慎之介 (東京大学), 飯森英治 (東京大学), 橘健太郎, 猿渡洋 (東京大学)

第137回MUS・第147回SLP合同研究発表会 (音学シンポジウム 2023)

2023.6.23
カンファレンス (国際)

Fully Unsupervised Topic Clustering of Unlabelled Spoken Audio Using Self-Supervised Representation Learning and Topic Model

Takashi Maekaku, Yuya Fujita, Xuankai Chang (Carnegie Mellon University), Shinji Watanabe (Carnegie Mellon University)

The International Conference on Acoustics, Speech, & Signal Processing 2023 (ICASSP 2023)

2023.6.7
カンファレンス (国際)

Adaptive Noise Canceller Algorithm with SNR-Based Stepsize and Data-Dependent Averaging

Akihiko Sugiyama

2023 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.5
カンファレンス (国際)

Linear Microphone Array Parallel to the Driving Direction for In-Car Speech Enhancement

Masanori Tsujikawa (NEC), Akihiko Sugiyama, Ken Hanazawa (NEC America), Yoshinobu Kajikawa (Kansai University)

2023 International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.5
カンファレンス (国際)

Conversation-oriented ASR with multi-look-ahead CBS architecture

Huaibo Zhao (Waseda University), Shinya Fujie (Waseda University), Tetsuji Ogawa (Waseda University), Jin Sakuma (Waseda University), Yusuke Kida, Tetsunori Kobayashi (Waseda University)

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.4
カンファレンス (国際)

Diffusion-based Generative Speech Source Separation

Robin Scheibler, Youna Ji (NAVER Cloud), Soo-Whan Chung (NAVER Cloud), Jaeuk Byun (NAVER Cloud), Soyeon Choe (NAVER Cloud), Min-Seok Choi (NAVER Cloud)

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.4
カンファレンス (国際)

Effectiveness of Inter- and Intra-subarray Spatial Features for Acoustic Scene Classification

Takao Kawamura (Tokyo Metropolitan University), Yuma Kinoshita (Tokyo Metropolitan University), Nobutaka Ono (Tokyo Metropolitan University), Robin Scheibler

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.4
カンファレンス (国際)

Lightweight and High-Fidelity End-to-End Text-to-Speech with Multi-Band Generation and Inverse Short-Time Fourier Transform

Masaya Kawamura (The University of Tokyo), Yuma Shirahata, Ryuichi Yamamoto, Kentaro Tachibana

2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)

2023.6.4

前へ

前のページ

1
…
3
4
5
…
13

次のページ

次へ