Publications

CONFERENCE (INTERNATIONAL)
Duality-based Residual Estimation for Fully Offline Value-based Reinforcement Learning: Kohei Miyaguchi; The 29th International Conference on Artificial Intelligence and Statistics (AISTATS 2026); May 02, 2026

OTHERS (INTERNATIONAL)
A Relative-Budget Theory for Reinforcement Learning with Verifiable Rewards in Large Language Model Reasoning: Akifumi Wachi, Hirota Kinoshita (Toyota Technological Institute at Chicago), Shokichi Takakura, Rei Higuchi (University of Tokyo/RIKEN AIP), Taiji Suzuki (University of Tokyo/RIKEN AIP); arXiv.org (arXiv); February 02, 2026

CONFERENCE (INTERNATIONAL)
Cost-Minimized Label-Flipping Poisoning Attack to LLM Alignment: Shigeki Kusaka (University of Tsukuba), Keita Saito (University of Tsukuba), Mikoto Kudo (University of Tsukuba/RIKEN AIP), Takumi Tanabe, Akifumi Wachi, Youhei Akimoto (University of Tsukuba/RIKEN AIP/Institute of Science Tokyo); The 40th Annual AAAI Conference on Artificial Intelligence (AAAI-26); January 24, 2026

CONFERENCE (INTERNATIONAL)
A Provable Approach for End-to-End Safe Reinforcement Learning: Akifumi Wachi, Kohei Miyaguchi, Takumi Tanabe, Rei Sato, Youhei Akimoto (University of Tsukuba, RIKEN AIP); The Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS 2025); December 05, 2025

CONFERENCE (INTERNATIONAL)
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies: Runze Yan (Emory University), Xun Shen (Tokyo University of Agriculture and Technology), Akifumi Wachi, Sebastien Gros (Norwegian University of Science and Technology), Anni Zhao (Emory University), Xiao Hu (Emory University); The Thirty-Ninth Annual Conference on Neural Information Processing Systems (NeurIPS 2025); December 03, 2025

OTHERS (INTERNATIONAL)
Vulnerability Mitigation for Safety-Aligned Language Models via Debiasing: Thien Q. Tran, Akifumi Wachi, Rei Sato, Takumi Tanabe, Youhei AKimoto (University of Tsukuba, RIKEN AIP); arXiv.org (arXiv); February 04, 2025

CONFERENCE (INTERNATIONAL)
Flipping-based Policy for Chance-Constrained Markov Decision Processes: Xun Shen (Osaka University), Shuo Jiang (Osaka University), Akifumi Wachi, Kazumune Hashimoto (Osaka University), Sebastien Gros (Norwegian University of Science and Technology); The 38th Annual Conference on Neural Information Processing Systems (NeurIPS 2024); December 13, 2024

CONFERENCE (INTERNATIONAL)
Stepwise Alignment for Constrained Language Model Policy Optimization: Akifumi Wachi, Thien Q. Tran, Rei Sato, Takumi Tanabe, Youhei Akimoto (University of Tsukuba); The 38th Annual Conference on Neural Information Processing Systems (NeurIPS 2024); December 11, 2024

CONFERENCE (INTERNATIONAL)
A Survey of Constraint Formulations in Safe Reinforcement Learning: Akifumi Wachi, Xun Shen (Osaka University), Yanan Sui (Tsinghua University); The 33rd International Joint Conference on Artificial Intelligence (IJCAI 2024); August 03, 2024

CONFERENCE (INTERNATIONAL)
Safe Reinforcement Learning Using Model Predictive Control with Probabilistic Control Barrier Function: Xun Shen (Osaka University), Akifumi Wachi, Wataru Hashimoto (Osaka University), Kazumune Hashimoto (Osaka University), Shigemasa Takai (Osaka University); 2024 American Control Conference (ACC 2024); July 10, 2024

CONFERENCE (INTERNATIONAL)
Watermark-embedded Adversarial Examples for Copyright Protection against Diffusion Models: Peifei Zhu, Tsubasa Takahashi, Hirokatsu Kataoka; The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2024 (CVPR 2024); June 17, 2024

CONFERENCE (INTERNATIONAL)
Long-term Safe Reinforcement Learning with Binary Feedback: Akifumi Wachi, Wataru Hashimoto (Osaka University), Kazumune Hashimoto (Osaka University); Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24); March 24, 2024

CONFERENCE (INTERNATIONAL)
Understanding Likelihood of Normalizing Flow and Image Complexity through the Lens of Out-of-Distribution Detection: Genki Osada, Tsubasa Takahashi, Takashi Nishide (University of Tsukuba); Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24); March 24, 2024

OTHERS (DOMESTIC)
Constitutional AI におけるセーフティアラインメントの改善: 綿岡晃輝, Thien Q. Tran, 前田若菜, 髙橋翼; 言語処理学会第30回年次大会 (NLP2024); March 04, 2024

OTHERS (DOMESTIC)
対話モデルに対する敵対的プロンプトの効率的な最適化: 矢野一樹 (東北大学), 綿岡晃輝, Thien Q. Tran, 髙橋翼, Seng Pei Liew, 鈴木潤 (東北大学/理化学研究所); 言語処理学会第30回年次大会 (NLP2024); March 04, 2024