上证报中国证券网讯(记者 于祥明)从词元交易到词元经济,中国人工智能(885728)产业方面的制度供给正在“加速”。
国家数据局局长刘烈宏日前主持召开词元经济座谈会,明确将把推动词元经济发展纳入工作体系,以行业高质量数据集建设和全国一体化算力网建设为着力点,深入推进数据要素(886041)市场化配置改革,推动词元经济高质量发展。
此前,国家数据局在《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》中,首次提出“探索词元交易等新型交易模式”,这是官方政策文件中首次出现“词元交易”这一表述。
词元是大模型处理文本、代码、图像、音频、视频等所有信息时采用的最小运算单元,正在成为人工智能(885728)服务的计量单位、结算单位和统计单位。
记者观察到,刘烈宏3月23日在中国发展高层论坛上正式将Token的译名定为“词元”,并将其定位为“智能时代的价值锚点”和连接技术供给与商业需求的“结算单位”。国家数据局也已经明确,将把推动词元经济发展纳入工作体系,持续跟踪研究并吸收社会各界建议。
从概念译名定下到交易探索再到纳入工作体系,仅仅两个月时间,国家数据局对词元经济的探索和政策供给层层递进。
目前,国家数据局已经明确两大发力点:行业高质量数据集建设和全国一体化算力网建设。
记者注意到,今年政府工作报告提出,打造智能经济新形态。建设高质量数据集被列为其中的一项工作。5月19日上午,高质量数据集建设现场会在广东省广州市召开。会议强调,下一步国家数据局将深入贯彻落实党中央、国务院关于人工智能(885728)发展的决策部署,组织实施强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大行动,加快推进高质量数据集建设和应用。
其中,强基扩容行动,将聚焦重点领域和创新领域,持续扩大供给规模,解决“有什么”的问题;标注攻坚行动,将发展人机协同智能化标注,强化专家型标注服务,解决“怎么加工”的问题;价值释放行动,将探索以词元为基础的数据价值体系,培育“为高质量数据付费”的市场共识,解决“如何释放价值”的问题。
显而易见,《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》提出的“词元交易”,正是探索以词元为基础的数据价值体系的举措之一。
记者注意到,此次征求意见稿的核心内容可概括为三个层次:第一层,完善数据集运营机制。鼓励数据集在数据交易所挂牌交易,发展“订阅模式”“商场模式”“定制模式”等多元服务形态,推动商业模式从基础数据包销售向API调用、模型化解决方案及全栈服务梯次跃升。
第二层,探索词元交易等新型模式。构建以词元为基础、可量化、可定价的数据集价值体系,培育为数据付费的市场共识。
第三层,推进数据资产化创新,释放数据要素(886041)价值。鼓励探索数据集质押融资、作价入股、资产证券化、数据信托、数据保险等多元化资产化创新模式,拓宽数据价值转化渠道。
这三层内容层层递进,共同勾勒出一条从数据流通到词元计价再到资产化变现的完整价值链。
当前,词元需求的爆发式增长,已经成为智能经济新形态的时代坐标之一。今年3月,中国日均词元调用量已突破140万亿,两年增长超千倍。日均140万亿词元调用量的背后,是AI从实验室走向千行百业的产业跃迁。词元已成为衡量AI产业活跃度、价值释放度的核心“晴雨表”。 有分析人士预计,我国若率先实现词元交易规范化,将为打造智能经济新形态提供重要支撑,并带动各个相关产业加速发展。
全国一体化算力网建设方面,也将有进一步的政策供给。据悉,国家数据局正加快研究制定全国一体化算力网技术标准,相关指导性技术文件已达12项,涵盖算力监测调度、算电协同、安全保护等多个方面,促进全国算力资源优化配置。
算力是综合国力的重要体现,算力网是“六张网”之一。国家发展改革委政策研究室副主任、新闻发言人李超近日在新闻发布会上表示,将抓紧出台相关规划和实施方案,进一步统筹“六张网”建设内容,明确各领域投资重点,将目标任务分解到年度,明确时间和进度安排。
这意味着,算力网建设的“施工图”已经在路上,其建设速度有望进一步提速。
