People
宮口 航平 Kohei Miyaguchi LINEヤフー研究所 主任研究員
IBM東京基礎研究所を経てLINEヤフー株式会社に入社。強化学習の研究に従事。特にバッチデータに基づく強化学習と方策評価に興味がある。著書(共著)に『強化学習から信頼できる意思決定へ』。博士(情報理工学)。詳細についてはhttps://koheimiya.github.io/ (外部サイト)を参照。
Publications
-
- その他 (国際)
- Inference-Aware Meta-Alignment of LLMs via Non-Linear GRPO
- Shokichi Takakura, Akifumi Wachi, Rei Higuchi (The University of Tokyo/RIKEN AIP), Kohei Miyaguchi, Taiji Suzuki (The University of Tokyo/RIKEN AIP)
- arXiv.org
- 2026.2.3
-
- カンファレンス (国際)
- A Provable Approach for End-to-End Safe Reinforcement Learning
- Akifumi Wachi, Kohei Miyaguchi, Takumi Tanabe, Rei Sato, Youhei Akimoto (University of Tsukuba, RIKEN AIP)
- The Thirty-Ninth Annual Conference on Neural Information Processing Systems
- 2025.12.5