Kejihao 文/卞海川
众所周知,随着以ChatGPT为代表的生成式AI大模型的火爆,汽车产业产业的竞争正在从新能源驶向智能化,而无论是传统车企,还是造车新势力,也无一例外地都将智能化作为发展的重点。那么问题来了,大模型真的可以让汽车智能化更上层楼吗?
大模型上车,智能座舱与自动驾驶是重点
从汽车行业与大模型的关系看,大模型可以在自动驾驶、驾驶舱智能化、人车传感器互联、工厂数字化等诸多方面产生价值。而从功能层面来看,大模型在汽车智能化方面主要体现在智能座舱和智能驾驶,也是车企们关注和用户体验的重点。
以智能座舱为例,当下,汽车的人机交互能力被许多用户诟病。如何改善车机交互水平,提升用户体验?AI大语言模型为OEM厂商提供了新的思路。当下,大语言模型等生成式AI大模型应用在智能座舱等车联网场景中展现出了巨大潜力,许多车企都将其视为战略储备技术之一。例如车载ChatGPT语音助手,可以处理完整的对话,比如追问,并能保持对前后文的理解,形成较为良好的语音交互体验。
比如,今年美国微软公司和德国汽车厂商梅赛德斯奔驰公司宣布,双方将展开合作,把ChatGPT人工智能服务整合到存量汽车中,美国地区90万辆汽车将因此受益。
据梅赛德斯奔驰介绍,未来车主在使用语音助手提问时,ChatGPT将会负责回答问题,增强汽车语音助手的negligible。微软公司发言人介绍称,这也是ChatGPT产品第一次应用在汽车环境中。实际上,微软与梅赛德斯—奔驰探索ChatGPT的插件生态系统,为第三方服务集成开辟了可能性,未来驾驶员可以通过车载系统完成预订餐厅、预订电影票等任务,将会极大丰富和提升智能汽车与人之间的交互体验。
而从目前国内的情况来看,已有多家车系宣布将在旗下车型上接入AI大模型,如长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等,它们均为文心一言的早期客户。
同样是在今年,百度Apollo汽车智能化业务展示了以文心大模型为基础的新一代AI智舱探索成果。百度Apollo演示了基于文心大模型能力探索下,智舱将具备出行场景对话式交互、逻辑推理、策略规划和知识问答等多项能力,同时也展示了在当前智舱命令式交互下覆盖全车多音区、毫秒级响应、免唤醒全时交互的体验。
除了智能座舱,AI大模型在自动驾驶领域同样有着广泛的应用前景。许多专家学者认为,AI大模型在自动驾驶领域的应用将会成为未来智能出行的重要驱动力之一,为自动驾驶技术的发展和普及做出重要贡献。
众所周知,大模型可以处理海量数据,同时具备多维度分析能力,可以提供更精准、更全面的数据分析和预测能力。保持对大模型的优化升级,就可以提高自动驾驶的准确性和可靠性。具体表现在在云端,车企可以发挥模型参数量的大容量优势,通过大模型完成绝大多数的数据标注和数据挖掘工作,节省数据标注成本,还能够借助仿真场景构建赋能。在车端,大模型可以将细分为多个附属子模型,分管不同子任务,节省车端的推理计算时间,增加行车安全性。
以特斯拉为例,随着AI大模型技术的发展,特斯拉率先采用了基于TransFormer大模型的BEV+占用网络感知算法,提升了环境建模的效率,成为目前主流车企下一代智能化的主要架构。通过这套感知架构能够减少对于激光雷达等高成本传感器的依赖,有效降低系统成本,减轻车企及消费者的负担。
新挑战显现,真正落地仍需时日
综上,我们看到,大模型在智能座舱上的应用是可以直观感受的,且已有应用出现,但对于自动驾驶,大模型上车还有很长的路要走或者说挑战更大。
首先从“硬”的方面看,业内知道,AI大模型的运行需要高规格的硬件配置支持,需要具备高算力、大容量内存以及低时延的特性。但现阶段车载设备的硬件水平虽然有所提升,但还无法达到支撑AI大模型运行的水平。以自然语言处理(NLP)的预训练模型GPT-3为例,需要数万亿次TOPS的计算能力,这就要求芯片的算力至少要在万级TOPS以上才能够胜任计算工作。
但从目前的车载硬件部署来看,即便目前蔚来、理想等造车新势力使用的英伟达Orin X芯片,单颗算力也仅为254TOPS,这已经是目前量产车中算力最高的芯片,远远达不到大模型的计算要求。而这也是为何特斯拉要自研芯片和建立云端智算中心Dojo的主要原因。
其次在“软”的数据层面,对其的处理也是不小的挑战,特别是现在日益流行的多模态数据,包括自动驾驶中激光雷达、毫米波雷达、超声波雷达等,以及专用的高清摄像头、GPS设备等搜集到的数据、场景数据(比如对交通标志与地面标线的学习与识别、对车流与人流的行为与相关应对模型等)等,这本就使得数据的处理、管理和使用变得相当困难,相比之下,大模型的数据量是有过之而无不及。
此外,诸如数据的隐私、安全的挑战也会随着数据量的爆炸式增长而增加。
值得一提的是,从“软”的感知算法的推进看,行业总体2022年及之前的的商业化应用主要为2D+CNN算法,而随着ChatGPT等AI大模型的兴起,感知算法已经升级至BEV。如我们前述,特斯拉在2021年就已经采用BEV+Transformer,国内的小鹏+华为+理想等今年才切换到BEV+Transformer,但仍应用于感知端,而受限于算法复杂性+大算力要求,感知决策一体的端到端算法落地尚需时日。
写在最后:综上,不可否认,大模型已经成为智能汽车行业的竞争焦点,可以为自动驾驶和智能座舱带来了巨大的潜力,改善驾驶安全性、优化交通流量和提供个性化的驾驶体验。与此同时,其在算力、算法及数据方面的新挑战也成为能否最终实现上述目标的阻碍,那么未来究竟是挑战大于机遇,还是机遇大于挑战,还需我们边走边看。