从“通用”到“懂行”:aiXcoder助通信客户打造企业专属大模型

2025-08-13 21:13:25 来源: 通信世界网
中性

  近日,硅心科技(aiXcoder)助力国内头部通信企业落地企业专属大模型,通过“增量预训练+后训练”技术、“大模型+小模型”策略、全链路私域数据治理体系、融入工作流和Agent技术等创新方案,实现代码生成准确率从20%提升至45%;企业知识问答准确率从51%提升至69%,突破了通用大模型“缺乏企业私域知识、不了解业务”的企业落地难题。

  “不是模型不够强,而是它不懂行”

  数字化转型的深入发展,让各行业对于高效、稳定且安全的网络连接需求日益增长。某大型通信公司作为行业头部企业,希望通过技术创新提升研发效能和市场竞争力,为千行百业筑牢关键数字底座。为此,该企业将大模型引入生产实践,期望大模型在企业知识问答、单元测试生成、代码生成等真实场景中提供智能辅助,以提升软件开发效率,降低开发成本。

  然而,在实际的应用中,大模型因缺乏企业私域数据和知识,如专有协议栈、设备交互逻辑等,输出的效果并不理想——知识问答常出现答非所问或泛泛而谈;输出结果缺乏业务逻辑支撑,可信度较低;生成的代码需工程师花费大量时间审查、修正甚至重写。

  “不是模型不够强,而是它不懂‘行话’。”企业发现,RAG(Retrieval-Augmented Generation,检索增强生成)等通用方案虽能通过知识检索辅助问答,却难以实现深度业务推理。

  为此,企业选择与在“AI+软件工程”领域具备深厚技术积累和丰富落地经验的硅心科技(aiXcoder)合作,通过训练企业专属大模型,将企业数据和知识深度注入模型。

  深度定制企业专属大模型,重构模型“大脑”

  具体实施方案如下:

  一、多维度综合评估,选择最优开源模型。硅心科技(aiXcoder)贴合企业现有算力资源和任务需求,从模型的基础效果、计算资源、推理效率以及应用可行性等方面进行综合考虑,并结合硅心科技(aiXcoder)专业模型评测体系、官方基准测试、中文理解评测、第三方模型排行榜等多方结果,交叉验证,为企业选出综合表现最优、与企业通信业务场景最适配的开源大模型作为领域化训练的坚实基础。

  二、企业私域数据治理,构建高质量训练语料。硅心科技(aiXcoder)指导企业系统性梳出内外部知识资产,并对数据进行预处理,创建结构化、可检索、可推理的企业私域知识体系。由此构建的高质量训练语料,一方面可作为企业专属大模型的训练数据,另一方面依托硅心科技aiXcoder领域化程序分析工具和Agent技术,可以将这些企业私域知识作为有效的上下文传递给大模型,支撑其更好完成软件开发任务。

  三、增量预训练+后训练,训练企业专属大模型。硅心科技(aiXcoder)以选定的开源大模型为基础,将高质量训练语料转化为模型可学习的训练样本,通过增量预训练阶段,让模型学会通信领域知识;通过后训练阶段,增强模型执行特定任务的能力。这增强了预训练模型的性能和适应性,使其具备深度的企业知识理解能力,以及单元测试生成、代码生成等核心场景的指令遵循和解决问题的能力。

  四、以企业真实数据为准,构建企业级测评集。为确保企业专属大模型在该通信企业核心业务中的实用价值,硅心科技(aiXcoder)基于企业内部数据构建训练集和测评集,以真实开发场景为准绳,模拟并评估模型在真实企业环境中的落地效果,确保企业专属大模型从技术能力到业务赋能的全面转化。

  挑战与突破并存,四大技术创新攻克项目难关

  在推进技术方案落地的过程中,硅心科技(aiXcoder)直面企业实际需求和项目实施难点,突破行业常规做法,以四大创新攻克关键瓶颈:

  一、创新采用“大模型+小模型”策略。大模型支持通用场景,比如复杂的Agent主流程构建;小模型支持企业特定的领域化问题,在解决企业特定任务时会更精准、高效。两者协同,既保证通用智能,又强化专业深度。

  二、构建全链路私域数据治理体系。硅心科技(aiXcoder)对“原始需求-设计-开发-测试”等各研发环节的企业数据进行系统性打通与关联构建。由此,当模型在执行具体任务时,它不仅能看到当前信息和上下文,还能参考研发全链路的相关信息,获得全局理解能力,大幅提升输出结果的准确性和实用性。

  三、创新融入工作流和Agent技术。企业核心业务智能化往往需要端到端的解决方案,但目前市场上并没有能直接解决端到端问题的大模型。为此,硅心科技(aiXcoder)在训练企业专属大模型的同时,创造性融入了工作流和Agent技术。通过精心设计的任务编排与Agent协同,有效补齐端到端的能力短板。

  四、利用AI辅助生成高质量训练数据。企业内部的私域知识和数据关系非常复杂,且数据量不足以支撑模型训练的需求。为此,硅心科技(aiXcoder)在严格遵循业务逻辑和安全规范的前提下,系统梳理和构建数据间的依赖关系,并利用大模型合成大量高质量、符合业务场景的训练数据,有效解决数据瓶颈难题。

  应用效果:企业知识问答准确率69%、代码生成准确率45%

  据企业反馈,企业专属大模型应用到实际任务中后,效果超出预期:企业知识问答的准确率由原来51%,提升至69%;代码生成准确率由原来的20%,上涨至45%。这显著提高企业的软件开发效率,使企业能够更快响应市场需求。

  不仅如此,企业专属大模型训练过程中所形成的数据治理框架、训练路径和方案都具备高度的可复用性。随着底层模型迭代、技术演进和业务需求的变化,企业可以在现有框架上快速适应、调整和新增数据,大幅降低后续训练成本,为企业在长期技术竞争中构建独特优势。

  硅心科技(aiXcoder)在通信行业的智能研发实践,不仅得到了企业客户的认可,也获得了行业机构的高度肯定。在2025全球数字经济大会上,aiXcoder“代码智能体在通信领域的应用”方案,获评“北京市人工智能赋能行业发展典型案例”。

关注同花顺财经(ths518),获取更多机会

0

+1
  • 中国长城
  • 长城军工
  • 工业富联
  • 华胜天成
  • 中电鑫龙
  • 广东建科
  • 东方精工
  • 光库科技
  • 代码|股票名称 最新 涨跌幅