李雲 | アカデミックホームページ

Abstract

PL-DPO-NLL の日本語ショート版。NLL 正則化付き Plackett–Luce 多重選好学習を用いて、視覚-言語-行動運転方策の安全制約アライメントを行う。JSAI 2026（群馬）にてポスター 4Yin-A-08 で発表。

JSAI 2026 採択（群馬）。