国双专家谈:“人工智能+”需与数据底座基础充分融合

2024-03-28 14:28:44 来源: 国双Gridsum

  2015年,“互联网+”一词首次被写入《政府工作报告》;

  2017年,“人工智能”一词首次出现在《政府工作报告》;

  2019年,“智能+”一词首次被写入《政府工作报告》;

  2024年,《政府工作报告》不仅三次提到“人工智能”,更首次提出了开展“人工智能+”行动。

  在今年全国两会上,政府工作报告中一个新关键词——“人工智能+”行动引发热议,这是“人工智能+”首次被写入政府工作报告中。创新性表述的背后往往蕴含着深远的战略意义。每当科技行业的新名词出现在《政府工作报告》中,它们都会在不同阶段推动产业的转型升级。“人工智能+”的提出,不仅顺应了全球AI技术发展的潮流,更与中国产业转型升级的浪潮紧密相连。

  一提到人工智能的相关技术,大家一定会首先想到炙手可热的大模型,对此国双产品专家认为:大模型的确是通用人工智能的热门方向,但如何将大模型应用于产业或者说实现产业智能化,这中间仍有诸多技术难点、卡点需要攻克,也同样有若干技术组件需要补充或与之配合,才有可能实现AI技术在产业中实现场景落地,最显而易见的,是无论模型还是其他智能化相关技术,都首先无法脱离优质的数据基础。

  数据是AI的“基石”与“血液”

  当前在全球信息化快速发展的大背景下,数据已经成为国家重要的基础性战略资源,正引领以AI为代表的新一轮科技创新,推动经济转型发展。AI技术的迭代需要以优质数据集作为基石,数据是AI的“血液”。作为一个数据密集领域,AI技术发展离不开数据支持,以海量数据603138)作为基础,数据越多则越优;场景特点越丰富,算法性能越高,模型也就能够更高效。

  国双产品专家认为:就国内众多复杂产业场景来看,我国切实具备雄厚的数据基础,丰富的数据资源等特点。而数据可以是AI输入的源头以及输出的结果,贯穿于AI技术发展的整个生命周期,数据存储与计算技术亦成为AI的基础设施之一,为其快速发展提供坚实支撑。例如:

  在数据收集和预处理阶段:源数据需要被妥善存储,数据量较大时需要分布式文件系统/大数据平台或对象存储等技术,如果数据量较小可以选择关系型数据库、数据仓库来管理数据。此外,从原始数据到训练数据还需预处理,则需要在数据平台中完成。

  在模型训练和推理阶段:模型的训练和调参过程不仅需要计算海量数据,并且需要反复学习、连续交互,近年模型的训练推理计算量指数级上升,一般都需要使用分布式的计算框架来处理大规模的数据和计算任务。

  在模型部署和应用阶段:部署应用环节的实时数据和决策等任务需要借助实时数据库或数据流处理系统来处理。

  随相关数字技术体系的逐步完善,AI技术迭代发展背后,对优质数据以及高性能数据处理的需求也必将愈加迫切;数据底座作为AI技术的“基石”,将为AI技术提供更加精准而丰富的信息支撑。国双作为一家始终为复杂产业、大型企业提供数字化、智能化转型一站式服务的软件厂商,基于长期持续的研发投入,自研积累出了一整套数据支撑AI落地的工具集,可实现为复杂产业场景快速搭建以数据驱动智能转型的大型“底座”,并且数据底座与智能底座还可轻松实现拆分或灵活的耦合式扩展。

  以国双在能源行业实践为例,国双的数据底座在服务某大型能源集团数字化、智能化转型升级的过程中,首先进行数据整合,构建底座,并引导数据有序的关联流动。项目建设之初即一次性采集196套数据库系统和所需的企业外部数据,打破数据孤岛,并实现支持上万个数据作业流进行周期性的流动。实际处理结构化数据量超过2PB,非结构化数据近1PB,在数据底座的支撑下,快速形成了21个一级主题域、70个二级主题域、近500个三级主题和3000多个业务实体的数据资源目录,为后续集团治理的智能化改造提供了坚实基础以及AI应用前提。

  AI技术也可为数据价值挖掘提供新的“路径”

  “实际上国双团队从2016年即发现并认同数据和AI是天然结合、相辅相成的,”国双产品专家说道,“通过直接在大数据底座之上搭建知识库、模型训练、模型推理等AI工具集,既可以复用原先的集群、底层存储、资源调度系统等,同时还能够降低系统建设成本和运维难度,实现数据采集分析、数据及智能应用、自动化服务等等诸多流程的一体化。”

  如今,国双数智底座通过集成大语言模型的理解及生成能力,令企业内不同部门的用户或可直接通过自然语言完成数据查询、调用及分析。AI与数据技术的融合将极大降低使用者上手门槛,使非技术专业的前端业务人员、管理者也能够更轻松的使用数据技术。同时这也必定会利好数据对业务场景的赋能,提高数据管理平台在企业内部的渗透使用率,并提升用户使用体验,赋能大型企业内数字化、智能化的体系化转型。

  例如,某行业研究院在采用国双数智底座的基础上,随大语言模型应用普及,客户随之即产生新的智能化应用需求。国双产品团队借助大型数智底座的原生能力,快速、高效的扩展出了智能文案等智能应用系统。不仅支持大语言模型前端能力融合,更强化提升了底层知识库、模型库构建的效率,为垂直领域业务专家快速提供例如语音转写、文案校对、文本润色、文案辅助编写等等一系列智能化功能。同时,借助符合业务逻辑的数据及知识管理、加工等底层能力,可让应用效果更精准的适配业务语境,规范符合特定行业及领域的文书创作及书写要求,高效满足领域专家的使用体验,成功实现技术模块的灵活耦合,为严肃、复杂的产业场景提供更加专业适配的技术方案。

  综上,AI技术和数据之间本有着极其紧密、不可分割的联系。数据是AI的核心基础,AI是数据技术的补充与提效。如果将AI技术的应用比喻为食品,那么数据就是食材,而融合技术就是高效生产的设备。没有原材料,很难产出加工后的精美产品。

  “作为加快新质生产力发展的重要技术组成,AI和数据将可能通过两个途径加快产业数智化转型升级及新质生产力发展,”国双产品专家谈到,“一个途径可能会通过创造新兴产业加以实现,而另一个最重要的途径无疑将是通过对传统产业的更新转换加以实现。而国双的数智底座产品自公司创立以来,就一直都在致力于为此目标进行开发并迭代。目前国双自研的数智底座,已历经油气、新能源、交通、先进制造、政务等多个跨行业、跨领域的复杂场景检验,并在虚实融合、赋能实体经济高质量发展的道路上斩获了大量企业客户认可。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 浩丰科技
  • 天和防务
  • 科大国创
  • 工业富联
  • 中衡设计
  • 宗申动力
  • 奥维通信
  • 国盛金控
  • 代码|股票名称 最新 涨跌幅