券商观点|计算机行业周报:智源发布“悟界”系列大模型,高德开放平台发布智能眼镜解决方案

2025-06-12 13:10:21 来源: 同花顺iNews

      2025年6月12日,华鑫证券发布了一篇计算机行业的研究报告,报告指出,智源发布“悟界”系列大模型,高德开放平台发布智能眼镜解决方案。

  报告具体内容如下:

  算力:智源发布“悟界”系列大模型,多项技术实现突破 6月6日,第七届智源大会开幕。作为主办方的智源研究院正式发布全新一代「悟界」系列大模型,标志着这家前沿科研机构在大模型领域的探索进入全新阶段。 具体而言,「悟界」系列涵盖多项重要成果:原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS2.0与具身大脑RoboBrain2.0,以及全原子微观生命模型OpenComplex2。

此次「悟界」系列中的原生多模态世界模型Emu3颇具技术亮点:通过引入新型视觉tokenizer,将图像与视频编码为与文本同构的离散符号序列,构建起无需区分模态的统一表征空间,实现文本、图像、视频任意模态组合的理解与生成。

6月6日,「悟界」系列推出跨本体具身大小脑协作框架

RoboOS2.0与具身大脑RoboBrain2.0,较1.0版本实现性能跨越式提升。

其中RoboOS2.0实现两项全球首创:全球首个基于具身智能SaaS平台的无服务器轻量化机器人本体部署开源框架,以及首个兼容MCP协议的跨本体具身大小脑协作框架。该框架通过引入「应用商店」模式,既推动协作生态繁荣,又降低开发成本;其开源特性对开发者友好,支持一键下载部署同型号机器人的小脑技能,实现大小脑即插即用协同。框架还采用小脑技能免适配注册机制,开发门槛显著降低,典型场景代码量仅为传统方式的1/10。

同时,「高效、可靠、智能协同」成为RoboOS2.0的显著特征:通过端到端推理链路的系统级优化,框架整体性能提升30%,全链路平均响应时延压缩至3毫秒以下,端云通信效率提升27倍;新增多本体时空记忆场景图共享机制,支持动态环境实时感知建模;引入多粒度任务监控与闭环反馈模块,显著提升任务执行稳定性与成功率。多重技术优化使其工程可用性与商业落地能力大幅增强。

配套的具身大脑RoboBrain2.0作为全球性能最强的开源具身智能大模型,在任务规划、空间推理等关键指标上全面超越主流模型,进一步巩固智源在具身智能领域的领先地位。

RoboBrain2.0在任务规划上,从依赖Prompt进化为多机协同规划系统,任务规划准确率提升74%;空间智能方面,性能提升17%,新增空间推理能力,可感知相对/绝对空间并进行多步推理;还新增深度思考与闭环反馈能力,前者分解复杂任务提升执行准确率,后者实时调整策略应对环境变化,使机器人在复杂3D空间中操作更智能。

智源在「悟界」系列中推出全原子微观生命模型OpenComplex2,标志多模态大模型在生命科学领域实现新突破。该模型不仅能预测蛋白质、DNA等生物分子静态结构,还可进行动态构象分布建模,描述能量景观并精准捕捉分子相互作用。其创新基于FloydNetwork图扩散框架与多尺度原子级表示,有效还原生物分子构象多样性和动态特性。

AI应用:Perplexity周平均访问量环比+1.71%,高德开放平台发布智能眼镜解决方案

6月5日,高德地图旗下高德开放平台正式发布智能眼镜解决方案,标志着其在空间计算与智能穿戴领域的技术创新迈入新阶段。

作为专业领先的出行和位置服务解决方案提供商,阿里巴巴集团旗下高德地图依托AI大模型、北斗高精定位技术,并应用Planner-Executor创新技术理念和架构,率先推出全球首个集“感知、规划、执行、表达”于一体的全链路AI导航智能体(NaviAgent),重新定义了智能出行的行业技术理念,为与各领域合作伙伴深度协同打下坚实的技术底座。高德已与Rokid、雷鸟创新、逸文、星纪魅族等AR行业领军企业达成战略合作,共同推出基于智能眼镜的导航智能体(NaviAgent)应用,建设“AI+AR”导航新生态。

通过深度场景化的Agent能力,高德智能眼镜解决方案实现了本地生活服务与导航功能的深度融合:一方面,它可提供深层次结构化信息查询服务,涵盖用户评分、榜单排行、门票价格、开放时间等多维度内容;另一方面,依托智能语音交互系统,支持用户执行包含路径偏好设定的复杂导航指令。

不仅如此,基于地图导航生态与大规模数据基座的高阶导航HUD展示,可动态感知实时路径、后方来车、红绿灯读秒等信息,提升出行智能性与安全性。以骑行为例,用户不仅能提前知晓并实时监测路况,还能通过语音添加途径点、查询剩余时间,甚至获取骑行公园推荐,以及阴凉覆盖和坡度路线等贴心信息。

除了导航与生活服务融合,高德在空间感知领域同样构建了卓越的技术壁垒。高德智能眼镜解决方案基于通义大模型,结合多元融合的技术方案,实现精准地点与建筑物识别,旅游导览时可自动识别景点并播放AR解说,语音提问可获实时解答。

高德持续推进智能穿戴设备领域的技术创新,基于强大的大数据处理能力,正同步助力智能穿戴生态系统的全面升级,包括智能手表解决方案的建设。该方案灵活适配多平台、多系统需求,全面兼容Android及RTOS系统,操作体验与手机端高度一致。未来,高德将继续深化与行业伙伴的合作,优化AR导航技术的精准度与适用场景,探索车载HUD、工业AR等更多创新应用。通过联动手机、车机、手表、眼镜等多端设备,推动智能穿戴设备成为下一代人机交互的重要入口,为用户创造无缝连接的智慧出行体验。

AI融资动向:Anysphere获9亿美元融资,Cursor技术助估值近百亿

6月5日,在Cursor1.0刚刚发布后的第二天,其背后公司Anysphere就宣布完成了一轮高达9亿美元的巨额融资。这轮融资由ThriveCapital、AndreessenHorowitz(a16z)、Accel及DSTGlobal等多家知名投资机构共同领投,使Anysphere的估值达到了99亿美元。从成立到接近百亿估值,Anysphere只用了三年时间。Cursor之所以能在众多AI编程工具中获得如今的地位,主要得益于其几个核心的技术特点。其中最受关注的是它的“AgentMode”(智能体模式)。该模式允许开发者用自然语言下达高层级的、跨文件的任务指令,例如“为整个项目重构数据库连接逻辑”或“实现用户登录的身份验证流程”。接到指令后,Cursor的智能体会自行分析项目中的相关文件,理解代码间的依赖关系,并自动执行一系列修改。

支撑这一能力的是其底层所采用的“模型上下文协议”(MCP,ModelContextProtocol)。Anysphere的团队认识到,AI模型生成代码的质量,直接取决于它所获取的上下文信息的广度和深度。而由Anthropic提出的MCP正是为此设计的,它允许Cursor高效地整合并理解整个代码库的信息,甚至可以连接到项目管理工具(如Linear)、设计工具(如Figma)和文档工具(如Notion)中的数据。

通过这种方式,AI的“视野”不再局限于代码本身,而是扩展到了整个软件开发的生命周期,使其能够做出更符合项目全局逻辑的判断和修改。在Cursor1.0版本中,官方进一步简化了MCP服务器的部署,让开发者和团队能更容易地利用这一优势。

此次获得的9亿美元融资,将为Anysphere的下一步发展提供充足的资源。公司称其将用于深化核心技术的研发,继续提升其AI智能体的能力,使其能应对更复杂的软件工程任务。同时,资金也将用于吸引更多顶尖技术人才,并加速其产品的商业化进程和市场拓展。

投资建议

关注字节火山引擎大会。6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance1.0pro等新模型,并升级了Agent开发平台等AI云原生服务。截至2024年12月,豆包大模型的日均tokens使用量为4万亿;2025年3月,该数据攀升至12.7万亿;截至2025年5月底,这一数字更是突破16.4万亿,持续保持高速增长趋势。梁汝波表示“AI技术仍处于发展早期会坚定长期投入”。

中长期,建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、以AI为核心的龙头厂商科大讯飞002230)(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息001314)(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力301439)(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技301196)(301196.SZ)等。

风险提示

1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

  更多机构研报请查看研报功能>>

  声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 三德科技
  • 沃尔核材
  • 电光科技
  • 钧崴电子
  • 金安国纪
  • 长盛轴承
  • 广和通
  • 科泰电源
  • 代码|股票名称 最新 涨跌幅