Abstract

PL-DPO-NLL の日本語ショート版。NLL 正則化付き Plackett–Luce 多重選好学習を用いて、視覚-言語-行動運転方策の安全制約アライメントを行う。JSAI 2026(群馬)にてポスター 4Yin-A-08 で発表。

JSAI 2026 採択(群馬)。