李云 | 个人学术主页

可打印的 PDF 版本见此处。

教育

博士候选人，东京大学情报理工学系研究科（塚田研究室），2023 年 9 月 – 2026 年 9 月（预计毕业）。论文：Safe and Efficient Generative Models for Autonomous Driving: From Preference-Aligned VLA to Real-Time Diffusion Planning。
工学硕士（信息通信工学），东京工业大学，2021 年 9 月 – 2023 年 9 月。GPA 3.57 / 4.0。
工学学士（车辆工程），吉林大学（中国），2017 年 9 月 – 2021 年 6 月。GPA 3.4 / 4.0。名古屋大学（日本）交换。

奖项与资助

JSPS 特别研究员 (DC2)，2026 – 2028 年度，课题号 26KJ0799 —《速思·迟思相结合的大语言模型强化学习驾驶判断》。KAKEN 页面。
SPRING GX Fellowship，东京大学，2024 – 2026。
WISE-SSS Core Research Grant，东京工业大学，2022 – 2023。

研究经历

华为 2012 实验室，深圳。研究实习生。2025 年 7 月 – 11 月。主导设计基于世界模型的轨迹生成框架；建立安全约束违反与控制平滑性量化指标，配合 seed-fixed 数据划分保证复现；通过 DPM-Solver（基于 ODE 的扩散采样）降低推理时延。
TIER IV, Inc.，东京。学生研究员。2024 年 4 月 – 至今。 Autoware 高级验证与 LLM 决策模块探索；与工程团队搭建最小可行实验环境，快速迭代评测指标与结果可视化。
卡内基梅隆大学，Nakahira Lab，匹兹堡。访问学者。2025 年 4 月 – 5 月。 Latent Safety Detection 框架；用视觉-语言模型将驾驶指令对齐到潜在表征，挖掘长尾失败案例。
NEC 数据科学研究实验室，神奈川。研究实习生。2022 年 8 月 – 9 月。基于深度强化学习的工厂机器人最优路径规划；将安全约束编码进奖励函数；2 个月内完成完整 R&D。
吉林大学汽车仿真与控制国家重点实验室，长春。研究助理。2020 年 9 月 – 2022 年 9 月。在该期间发表 3 篇关于约束安全强化学习自动驾驶的 IEEE Transactions 论文。

论文

国际会议论文（第一作者）

Yun Li, E. Javanmardi, S. Thompson, K. Katsumata, A. Orsholits, M. Tsukada. “Multi-PrefDrive: Optimizing Large Language Models for Autonomous Driving Through Multi-Preference Tuning.” IEEE/RSJ IROS 2025，中国杭州。（机器人顶会）
Yun Li, E. Javanmardi, S. Thompson, K. Katsumata, A. Orsholits, M. Tsukada. “PrefDrive: Enhancing Autonomous Driving through Preference-Guided Large Language Models.” IEEE IV 2025，罗马尼亚 Cluj-Napoca。
Yun Li, K. Katsumata, E. Javanmardi, M. Tsukada. “Large Language Models for Human-like Autonomous Driving Decision Making: A Survey.” IEEE ITSC 2024，加拿大 Edmonton。
Yun Li, S. Thompson, Y. Zhang, E. Javanmardi, M. Tsukada. “An Open-Source Modular Benchmark for Diffusion-Based Motion Planning in Closed-Loop Autonomous Driving.” IEEE ITSC 2026，意大利那不勒斯。
Yun Li, E. Javanmardi, Y. Zhang, S. Thompson, Q. Zhang, Z. Zeng, S. Liu, P. Wang, Z. Guo, M. Tsukada. “Learning Diffusion Planners from World Feedback: A No-Go Result on Bit-Exact Safety Rewards and an ODD-Adaptive Shared/Expert Decomposition.” RLxF Workshop, ICML 2026，韩国首尔。
Yun Li, S. Thompson, A. Orsholits, 塚田学. “正則化付き多重選好学習による自動運転 VLA モデルの安全制約アライメント.” 人工知能学会全国大会 (JSAI 2026)，日本群马。
Yun Li, Y. Chang, K. Fukawa, N. Kodama. “Reinforcement Learning-Based Cognitive Radio Transmission Scheduling in Vehicular Systems.” IEEE VTC-Spring 2023。

期刊论文（与指导教师 Rui Zhao 共著）

R. Zhao, Yun Li（学生一作）, K. Wang, Y. Fan, F. Gao, Z. Gao. “Centralized Cooperation for Connected Autonomous Vehicles at Intersections by Safe Deep Reinforcement Learning.” IEEE Transactions on Mobile Computing, 2025. [IF = 7.9, CCF A]
R. Zhao, Yun Li（学生一作）, Y. Fan, F. Gao, M. Tsukada, Z. Gao. “A Survey on Recent Advancements in Autonomous Driving Using Deep Reinforcement Learning: Applications, Challenges, and Solutions.” IEEE T-ITS, 2024. [IF = 7.9, CCF A]
R. Zhao, K. Wang, Yun Li, Y. Fan, F. Gao, Z. Gao. “Safe Multi-Agent Deep Reinforcement Learning for the Management of Autonomous Connected Vehicles at Future Intersections.” IEEE Transactions on Parallel and Distributed Systems, 2024. [IF = 5.6, CCF A]
R. Zhao, Yun Li（学生一作）, F. Gao, Z. Gao, T. Zhang. “Multi-Agent Constrained Policy Optimization for Conflict-Free Management of Connected Autonomous Vehicles at Unsignalized Intersections.” IEEE T-ITS, 2023. [IF = 7.9, CCF A]
R. Zhao, Y. Fan, Yun Li, K. Wang, C. Zheng, F. Gao, Z. Gao. “Autonomous Intersection Management via Prior-Enhanced Multi-Agent Constrained Decision Transformer.” IEEE T-ITS, 2025. [IF = 8.5, Q1]
R. Zhao, K. Wang, Yun Li, Y. Fan, F. Gao, Z. Gao. “Centralized cooperative control for autonomous vehicles at unsignalized all-directional intersections: A multi-agent projection-based constrained policy optimization approach.” Expert Systems with Applications, 2023. [IF = 8.5, Q1]
R. Zhao, Q. Yuan, J. Li, H. Hu, Yun Li, Z. Gao, F. Gao. “Sce2DriveX: A generalized MLLM framework for scene-to-drive learning.” IEEE Robotics and Automation Letters, 2024. [IF = 5.2, Q1]
R. Zhao, Yun Li（学生一作）, H. Hu, Z. Gao. “Vehicle Collision Warning Method at Intersection Based on V2I Communication.” 吉林大学学报, 2024。
其他共著论文（Sensors 2024–2025）：DriveLLaVA、Cockpit-Llama、知识蒸馏增强 Behavior Transformer、序列决策 Transformer、约束引导 Behavior Transformer、智能座舱分类、安全 DRL 自适应巡航、安全 RL 高速公路鲁棒决策等。

专利

Yun Li, R. Zhao, Z. Gao. “基于深度强化学习的自动驾驶交叉口无冲突协同方法.” 中国专利 CN115457782A，2023。

邀请报告

“Preference-Guided LLMs for Driving Assistance.” SPADE Workshop @ IEEE IV 2025，罗马尼亚 Cluj-Napoca。邀请报告 + Panel。
“Foundation Models for Autonomous Driving.” FMAD Workshop @ IEEE ITSC 2024，加拿大 Edmonton。
“Large Language and Vision Models for Autonomous Driving.” LLVM-AD Workshop @ IEEE ITSC 2024，加拿大 Edmonton。
“Vision Language Model based Human-Centered Autonomous Driving.” VLM-AD Workshop @ IEEE ITSC 2024，加拿大 Edmonton。

学术服务

期刊与会议审稿人；记录见 Web of Science ResearcherID PEV-4339-2025。

期刊：IEEE T-ITS、IEEE TVT、IEEE IoTJ、Neurocomputing、Results in Engineering。
会议：IEEE IV、IEEE ITSC、IEEE/RSJ IROS。

技能

核心研究方向：世界模型、LLM 对齐、安全强化学习、自动驾驶、扩散模型。
编程：Python（精通，5 年以上）、C++（熟练，3 年以上）、MATLAB。
框架与工具：PyTorch、JAX、ROS 2、Autoware、AWSIM、nuPlan、CARLA、Docker、Linux、ONNX / TensorRT。
语言：英语（专业工作）、日语（母语水平）、中文（母语）。