2024年汽车智能化关键词:AI大模型、纯视觉+端到端
经济观察网 周信/文 2024年被广泛认为是人工智能的元年,人工智能的研究与应用如雨后春笋般涌现。得益于此,2024年汽车智能化飞速发展,不管是智能座舱还是智能驾驶,都有了质变性的提升。
AI大模型的应用,促使汽车智能座舱的听、说、人机交互、车手互联、个性化体验实现了全面升级,汽车座舱能够更流畅、更智能地理解用户,并提供定制化的服务和体验。
而“端到端”技术的应用,则让高等级智能辅助驾驶从高速NOA向城市NOA快速突进,此前众多车企规划的逐步“开城”计划也迅速转向“全国开城”,城市NOA的技术的迭代速度越来越快,智驾技术也越来越像“老司机”。
在AI加持下,新一轮智能化革命蓄势待发。AI Agent即将上车,最终将实现人“人”交互。在端到端技术尚未完全被消化之际,业内又掀起“一段式端到端”自动驾驶技术竞赛,各家企业都希望在智驾技术方面实现跨越性的领先。
但与此同时,智能化的发展深度依赖数据、算法、算力。“到了人工智能时代,汽车行业最缺的是智算的基础设施,这也将会成为智能网联汽车加速发展的主要矛盾。”中国电动汽车百人会副理事长兼秘书长张永伟表示。
AI大模型让智能座舱更类人
随着智能化技术的日新月异,车企比拼智驾、智舱技术上车的节奏令人眼花缭乱,也让很多人享受到了智能化进步带来的更好体验。
2019至2022年,预训练模型(Pre-trained Model)井喷式出现;2023年,首个真正意义上的大语言模型(Large Language Model)ChatGPT落地,谷歌、亚马逊、百度、阿里、腾讯等科技巨头先后加入。
根据网信办发布的数据统计,目前已有超过283个大模型通过备案。大模型与其他模型最大的区别在于“涌现”能力,有了类人的“思维方式”。在预训练阶段,随着模型规模的扩大和参数量的提升,在超过某一阈值后,模型准确度就会大幅提升。
去年12月,理想汽车开始批量推送OTA5.0,认知大模型Mind GPT首次上车,赋能理想汽车智能助手“理想同学”拥有类似于 ChatGPT、Midjourney 等生成式 AI 的能力,拉开了智能座舱的AI竞争序幕。
在智能座舱领域,现阶段AI大模型主要应用于车载语音助手,通过深化语义理解和优化语料生成,AI大模型能够精准捕捉用户的意图与需求,提供自然、拟人、流畅且逻辑清晰的回答与建议。
今年4月,蔚来汽车自研的AI大模型NOMI GPT上线,实现了视觉(图像)、听觉(声音)、触觉(车身传感器信息)等维度的感知能力,具备包括语音、视觉和文本等多种形式的交互能力。
AI大模型还具备强大的短期记忆及长期记忆,长期记忆存储和回忆过去的数据和经验,短期记忆帮助快速响应和即时处理信息。基于此,座舱能够主动为用户提供音乐、新闻、导航等信息,自动调整座椅位置、后视镜角度、氛围灯颜色、空调温度等。
目前,AI在智能座舱上的应用更多是通过语音识别、图像识别等提升感知模块的准确度。而随着多模态及大模型技术的发展,基于语音、手势控制和视觉多模态能够让智能座舱更加准确地识别用户需求和意图。
在AI智能体的作用下,智能座舱能提升复杂问题的快速拆解、推理、决策、并分发执行的技术能力,切实解决用户困难,满足或预测用户需求,实现类人的执行能力,进行主动交互,提供个性化服务。
同时,智能座舱也将真正向改变场景体验转变,打破“车”“家”“手机”的功能和习惯壁垒,在高频率使用能工上深挖功能与场景结合,在低频使用的功能方面则进一步提升已用、实用性,让汽车真正成为用户第三智能空间。
“端到端“助推高阶智驾快速普及
除了智能座舱,智能驾驶辅助技术在今年也实现了革命性的进步。今年3月,特斯拉推出采用“端到端”自动驾驶解决方案的V12版本FSD(全称Full-Self Driving,完全自动驾驶)能够高度模拟人类驾驶行为,实现感知决策一体化,引起了全球汽车产业的震动。
所谓“端到端自动驾驶”,一般指控制系统读取原始传感器的数据后,仅通过神经网络直接计算出控制指令,其中不包含任何人为设计的规则模块。
在特斯拉推出“端到端”后,国内的造车新势力企业也开始上马“端到端”智驾技术。小鹏汽车在“520AI DAY”发布会上宣布,小鹏国内首个“端到端”大模型量产上车。7月,理想汽车发布了基于“端到端”模型、VLM 视觉语言模型和世界模型的全新自动驾驶技术架构。
在特斯拉布局“端到端”技术的时候,国内智驾公司如Momenta、元戎启行等也于2023年做出了相关布局。商汤绝影、百度Apollo、轻舟智航等供应商,也公布了各自在“端到端”领域的计划和落地进展。
传统自主车企依托智驾供应商的技术,也快速实现了“端到端”的上车。8月,采用元戎启行“端到端”智驾方案的魏牌全新蓝山,成为中大型新能源SUV市场的爆款车型。采用Momenta“端到端”高阶智驾方案的广汽埃安第二代AION V霸王龙、埃安RT都取得了不错的市场反响。
与“端到端”技术一起发展的还有去激光雷达的纯视觉技术路线。小鹏汽车发布了AI鹰眼视觉方案,华为带来了ADS SE(乾崑智驾的基础版)、卓驭(原大疆车载)带来了成行平台。智驾供应商如鉴智机器人、商汤绝影、文远知行等也都发布了纯视觉智驾方案。
“纯视觉+端到端,让高阶智驾技术快速迭代、快速普及。地平线方面向经济观察网表示,截至2024年10月,中国自主品牌高阶智驾渗透率达到了11.7%,2024年推出的NEV新车种,L2+及以上级别智能驾驶功能的搭载率超过50%。
在“端到端“技术正火热,众多车企甚至还没上马端到端技术之际,“一段式端到端”又成为众多自动驾驶公司和车企的布局重点。
相比“两段式端到端”方案将信息经过感知模型过滤后再到规控模型的两个信息处理环节,“一段式端到端”将智驾的感知、预测决策、规划多个模块合为一体,直接从传感器输入外部环境信息,并输出车辆的行驶轨迹,只有一个信息处理环节。
今年4月的北京车展上,商汤绝影发布了其“一段式端到端“自动驾驶技术DriveAGI; 9月底,Momenta也发布了首个量产“一段式端到端”智驾大模型。小米、华为等众多企业也开始布局“一段式端到端“。
辰韬资本联合多家单位在8月发布的2024年度《端到端自动驾驶行业研究报告》认为,“一段式端到端”系统中性预期落地时间会晚于模块化端到端1~2年时间,从2026年至2027年开始上车量产。
在AI大模型推高智能座舱和智驾竞争天花板的同时,AI算力也在急剧消耗。人工智能三要素是数据、算法、算力,整个产业链是倒三角结构,越往算力方向发展,能提供高算力的厂家越少。
根据中国电动汽车百人会的数据,“端到端”智能驾驶领域的起步算力为1 EFLOPS,而座舱大模型的基础模型算力需求大于10EFLOPS,垂域模型算力需求为数百到数千PFLOPS 。
理想状态下,一家车企在“端到端”大模型上消耗的算力就高达100 EFLOPS。但数据显示,国内车企现有的算力都在10 EFLOPS以下,中国移动(600941)、中国电信(601728)、中国联通(600050)三大运营商的规划算力合计才53 EFLOPS。
如何追求端云一体化,更好地执行更高的算力,降低主机厂单车成本,同时优化云端算力成本,是当前行业面临的主要挑战。
0人
- 每日推荐
- 股票频道
- 要闻频道
- 港股频道
- 人形机器人最新发布!杠杆资金出手
- 2025年1月1日起我国调整部分商品关税税率税目
- 荣耀完成股改,将适时启动IPO流程
- 142家公司获机构调研(附名单)
- "宁王"将赴港上市 推进全球化布局
- 白色家电获主力净流入逾6亿元
- 大规模设备更新成效初显 上市公司抢抓机遇
- 多只热门标的12月获券商调研
- AI时代,如何培养 “数+”经管人才