Abstract

通用 MLLM 框架,将驾驶场景直接映射到控制动作,在多个闭环基准上提供统一的 prompt-图像接口。

已发表,IEEE RA-L 2024。