LINEヤフーの研究開発

JP
EN

People

宮口航平 Kohei Miyaguchi LINEヤフー研究所主任研究員

IBM東京基礎研究所を経てLINEヤフー株式会社に入社。強化学習の研究に従事。特にバッチデータに基づく強化学習と方策評価に興味がある。著書（共著）に『強化学習から信頼できる意思決定へ』。博士（情報理工学）。詳細についてはhttps://koheimiya.github.io/ （外部サイト）を参照。

Publications

カンファレンス (国際)

Inference-Aware Meta-Alignment of LLMs via Non-Linear GRPO

Shokichi Takakura, Akifumi Wachi, Rei Higuchi (The University of Tokyo/RIKEN AIP), Kohei Miyaguchi, Taiji Suzuki (The University of Tokyo/RIKEN AIP)

Forty-Third International Conference on Machine Learning

2026.7.8
カンファレンス (国際)

Duality-based Residual Estimation for Fully Offline Value-based Reinforcement Learning

Kohei Miyaguchi

The 29th International Conference on Artificial Intelligence and Statistics

2026.5.2
その他 (国際)

Inference-Aware Meta-Alignment of LLMs via Non-Linear GRPO

Shokichi Takakura, Akifumi Wachi, Rei Higuchi (The University of Tokyo/RIKEN AIP), Kohei Miyaguchi, Taiji Suzuki (The University of Tokyo/RIKEN AIP)

arXiv.org

2026.2.3
カンファレンス (国際)

A Provable Approach for End-to-End Safe Reinforcement Learning

Akifumi Wachi, Kohei Miyaguchi, Takumi Tanabe, Rei Sato, Youhei Akimoto (University of Tsukuba, RIKEN AIP)

The Thirty-Ninth Annual Conference on Neural Information Processing Systems

2025.12.5