简历
可打印的 PDF 版本见 此处。
教育
- 博士候选人,东京大学 情报理工学系研究科(塚田研究室),2023 年 9 月 – 2026 年 9 月(预计毕业)。 论文:Safe and Efficient Generative Models for Autonomous Driving: From Preference-Aligned VLA to Real-Time Diffusion Planning。
- 工学硕士(信息通信工学),东京工业大学,2021 年 9 月 – 2023 年 9 月。GPA 3.57 / 4.0。
- 工学学士(车辆工程),吉林大学(中国),2017 年 9 月 – 2021 年 6 月。GPA 3.4 / 4.0。名古屋大学(日本)交换。
奖项与资助
- JSPS 特别研究员 (DC2),2026 – 2028 年度,课题号 26KJ0799 —《速思·迟思相结合的大语言模型强化学习驾驶判断》。KAKEN 页面。
- SPRING GX Fellowship,东京大学,2024 – 2026。
- WISE-SSS Core Research Grant,东京工业大学,2022 – 2023。
研究经历
- 华为 2012 实验室,深圳。研究实习生。2025 年 7 月 – 11 月。 主导设计基于世界模型的轨迹生成框架;建立安全约束违反与控制平滑性量化指标,配合 seed-fixed 数据划分保证复现;通过 DPM-Solver(基于 ODE 的扩散采样)降低推理时延。
- TIER IV, Inc.,东京。学生研究员。2024 年 4 月 – 至今。 Autoware 高级验证与 LLM 决策模块探索;与工程团队搭建最小可行实验环境,快速迭代评测指标与结果可视化。
- 卡内基梅隆大学,Nakahira Lab,匹兹堡。访问学者。2025 年 4 月 – 5 月。 Latent Safety Detection 框架;用视觉-语言模型将驾驶指令对齐到潜在表征,挖掘长尾失败案例。
- NEC 数据科学研究实验室,神奈川。研究实习生。2022 年 8 月 – 9 月。 基于深度强化学习的工厂机器人最优路径规划;将安全约束编码进奖励函数;2 个月内完成完整 R&D。
- 吉林大学 汽车仿真与控制国家重点实验室,长春。研究助理。2020 年 9 月 – 2022 年 9 月。 在该期间发表 3 篇关于约束安全强化学习自动驾驶的 IEEE Transactions 论文。
论文
国际会议论文(第一作者)
- Yun Li, E. Javanmardi, S. Thompson, K. Katsumata, A. Orsholits, M. Tsukada. “Multi-PrefDrive: Optimizing Large Language Models for Autonomous Driving Through Multi-Preference Tuning.” IEEE/RSJ IROS 2025,中国杭州。(机器人顶会)
- Yun Li, E. Javanmardi, S. Thompson, K. Katsumata, A. Orsholits, M. Tsukada. “PrefDrive: Enhancing Autonomous Driving through Preference-Guided Large Language Models.” IEEE IV 2025,罗马尼亚 Cluj-Napoca。
- Yun Li, K. Katsumata, E. Javanmardi, M. Tsukada. “Large Language Models for Human-like Autonomous Driving Decision Making: A Survey.” IEEE ITSC 2024,加拿大 Edmonton。
- Yun Li, S. Thompson, Y. Zhang, E. Javanmardi, M. Tsukada. “An Open-Source Modular Benchmark for Diffusion-Based Motion Planning in Closed-Loop Autonomous Driving.” IEEE ITSC 2026,意大利那不勒斯。
- Yun Li, E. Javanmardi, Y. Zhang, S. Thompson, Q. Zhang, Z. Zeng, S. Liu, P. Wang, Z. Guo, M. Tsukada. “Learning Diffusion Planners from World Feedback: A No-Go Result on Bit-Exact Safety Rewards and an ODD-Adaptive Shared/Expert Decomposition.” RLxF Workshop, ICML 2026,韩国首尔。
- Yun Li, S. Thompson, A. Orsholits, 塚田学. “正則化付き多重選好学習による自動運転 VLA モデルの安全制約アライメント.” 人工知能学会全国大会 (JSAI 2026),日本群马。
- Yun Li, Y. Chang, K. Fukawa, N. Kodama. “Reinforcement Learning-Based Cognitive Radio Transmission Scheduling in Vehicular Systems.” IEEE VTC-Spring 2023。
期刊论文(与指导教师 Rui Zhao 共著)
- R. Zhao, Yun Li(学生一作), K. Wang, Y. Fan, F. Gao, Z. Gao. “Centralized Cooperation for Connected Autonomous Vehicles at Intersections by Safe Deep Reinforcement Learning.” IEEE Transactions on Mobile Computing, 2025. [IF = 7.9, CCF A]
- R. Zhao, Yun Li(学生一作), Y. Fan, F. Gao, M. Tsukada, Z. Gao. “A Survey on Recent Advancements in Autonomous Driving Using Deep Reinforcement Learning: Applications, Challenges, and Solutions.” IEEE T-ITS, 2024. [IF = 7.9, CCF A]
- R. Zhao, K. Wang, Yun Li, Y. Fan, F. Gao, Z. Gao. “Safe Multi-Agent Deep Reinforcement Learning for the Management of Autonomous Connected Vehicles at Future Intersections.” IEEE Transactions on Parallel and Distributed Systems, 2024. [IF = 5.6, CCF A]
- R. Zhao, Yun Li(学生一作), F. Gao, Z. Gao, T. Zhang. “Multi-Agent Constrained Policy Optimization for Conflict-Free Management of Connected Autonomous Vehicles at Unsignalized Intersections.” IEEE T-ITS, 2023. [IF = 7.9, CCF A]
- R. Zhao, Y. Fan, Yun Li, K. Wang, C. Zheng, F. Gao, Z. Gao. “Autonomous Intersection Management via Prior-Enhanced Multi-Agent Constrained Decision Transformer.” IEEE T-ITS, 2025. [IF = 8.5, Q1]
- R. Zhao, K. Wang, Yun Li, Y. Fan, F. Gao, Z. Gao. “Centralized cooperative control for autonomous vehicles at unsignalized all-directional intersections: A multi-agent projection-based constrained policy optimization approach.” Expert Systems with Applications, 2023. [IF = 8.5, Q1]
- R. Zhao, Q. Yuan, J. Li, H. Hu, Yun Li, Z. Gao, F. Gao. “Sce2DriveX: A generalized MLLM framework for scene-to-drive learning.” IEEE Robotics and Automation Letters, 2024. [IF = 5.2, Q1]
- R. Zhao, Yun Li(学生一作), H. Hu, Z. Gao. “Vehicle Collision Warning Method at Intersection Based on V2I Communication.” 吉林大学学报, 2024。
- 其他共著论文(Sensors 2024–2025):DriveLLaVA、Cockpit-Llama、知识蒸馏增强 Behavior Transformer、序列决策 Transformer、约束引导 Behavior Transformer、智能座舱分类、安全 DRL 自适应巡航、安全 RL 高速公路鲁棒决策等。
专利
- Yun Li, R. Zhao, Z. Gao. “基于深度强化学习的自动驾驶交叉口无冲突协同方法.” 中国专利 CN115457782A,2023。
邀请报告
- “Preference-Guided LLMs for Driving Assistance.” SPADE Workshop @ IEEE IV 2025,罗马尼亚 Cluj-Napoca。邀请报告 + Panel。
- “Foundation Models for Autonomous Driving.” FMAD Workshop @ IEEE ITSC 2024,加拿大 Edmonton。
- “Large Language and Vision Models for Autonomous Driving.” LLVM-AD Workshop @ IEEE ITSC 2024,加拿大 Edmonton。
- “Vision Language Model based Human-Centered Autonomous Driving.” VLM-AD Workshop @ IEEE ITSC 2024,加拿大 Edmonton。
学术服务
期刊与会议审稿人;记录见 Web of Science ResearcherID PEV-4339-2025。
- 期刊:IEEE T-ITS、IEEE TVT、IEEE IoTJ、Neurocomputing、Results in Engineering。
- 会议:IEEE IV、IEEE ITSC、IEEE/RSJ IROS。
技能
- 核心研究方向:世界模型、LLM 对齐、安全强化学习、自动驾驶、扩散模型。
- 编程:Python(精通,5 年以上)、C++(熟练,3 年以上)、MATLAB。
- 框架与工具:PyTorch、JAX、ROS 2、Autoware、AWSIM、nuPlan、CARLA、Docker、Linux、ONNX / TensorRT。
- 语言:英语(专业工作)、日语(母语水平)、中文(母语)。