Cloudera:企业如何掌控专有数据
Cloudera亚太地区高级副总裁 林万发
机器学习(ML)和生成式AI在提升生产力和推动创新等方面的潜力已毋庸置疑。然而,一些还未解决的基础数据问题正阻碍企业把握这一机遇。Gartner预测,由于数据质量低下等因素,至少30%的生成式AI项目将被放弃。
随着数据量激增,新的数据源不断涌现,企业越来越难以从分散在云端、边缘计算、数据中心、大型主机和终端设备的关键信息中挖掘价值。
IT领导者对此深有同感。Cloudera《2024年企业AI和现代数据架构现状》调查显示,73%的受访者承认其企业内部存在数据孤岛,甚至有超过半数的受访者十分抗拒访问公司的所有数据。缺乏可信的数据,企业就无法及时获得准确的洞察。
事实上,受访的其他部门领导者也证实了这一观点。许多人表示,由于数据基础薄弱,他们难以证明AI或生成式AI的投资回报率。根据埃森哲《2025中国企业数字化转型指数》调查显示,尽管很多中国企业已开始全面拥抱AI,但只有21%的企业能够以较快速度实现大规模AI落地,仅9%的企业通过生成式AI实现显著价值转化。与此相呼应,Cloudera发布的《企业AI智能体的未来》报告显示,不清晰的投资回报率(ROI)是阻碍AI智能体落地的主要障碍,其中67%的中国受访者表示,业务价值和ROI不明确是其所在组织尚未采用AI智能体的首要原因。
为充分释放AI的价值,企业首先需要夯实数据基础,确保数据的质量、可访问性和可靠性,从而使AI投资转化为可衡量的业务价值。
数据平台应以业务而非IT为中心
未被使用的数据通常质量低下,且往往来自于旧系统和过时流程。大多数企业仍在使用传统IT平台和数据管理框架,它们的设计初衷是为了适应模拟技术时代或云时代前的业务环境。这些陈旧系统既无法跟上当前数据产生的惊人速度,也难以应对日益复杂的数据集,更不具备实时分析和弹性扩展的能力,最终可能导致关键决策的速度和灵活性大打折扣。
确保数据可靠性和AI就绪性的唯一途径是采用现代化的混合数据架构。这种架构能够帮助企业简化数据访问、实现数据结构化,并提炼出可操作的业务洞察。
在部署强大的数据平台时,应以业务为中心,而非IT,因为平台需要满足数据访问、安全性、成本效率等多项战略企业需求。
满足关键业务需求
大多数企业所处的多云、混合环境进一步加剧了识别数据集的复杂性。数据和工作负载在本地与公有云中的分布动态变化,也使得实时访问和识别数据的难度增加。仅过去一年,我们就观察到许多企业出于安全或成本考虑,将工作负载回迁至私有云。混合数据平台简化了这一过程,使企业能够轻松地将数据集跨环境迁移,同时不再需要重新编写数据管理和分析应用,大幅降低了运营复杂度。
现代数据架构的另一个关键特征是具备可解析非结构化数据的分析工具。根据《Gartner 2022年存储战略路线图》的预测,新形式的非结构化数据每年将增长30%至60%,这些数据可转化为实际业务价值。例如,零售商在社交媒体渠道、电商网站及合作伙伴渠道的海量用户评价和反馈,经过深度分析可以转化为提升流量、提高评分和优化客户体验的宝贵洞察。
在成本效率方面,混合数据平台赋予企业弹性扩展的能力,既能支持业务扩张和新市场开拓,又能确保在满足增长需求的同时,避免性能损耗和成本浪费。
此外,由于数据安全与合规性已成为影响业务成败的关键因素,内置安全治理机制的混合数据管理平台已成为刚需。通过加密、访问控制和审计等功能,企业能够有效保护敏感数据,降低泄露风险,这对金融服务等强监管行业尤为重要。
稳固企业数据基础
以印度尼西亚OCBC NISP银行为例,这家上市公司面临着数字化挑战,需要在激烈的竞争环境中确立数字化优势。为充分挖掘生成式AI解决方案的巨大潜力,该行设计并落实了一项完美契合其数据湖的混合数据策略,使数据科学家和企业用户能够高效使用各种集成应用。
印度尼西亚OCBC NISP银行以该混合数据平台为核心基础,构建了一个带有生成式AI项目工具和框架的可扩展基础设施,能够为客户提供基于Transformer架构的实时智能个性化推荐AI模型。凭借这一强大而灵活的基础设施,该行实现了AI与企业的大规模整合,更好地推动了客户创新并提高了监管报告效率。
分析、机器学习、AI和生成式AI为企业提高创新力、生产力、成本效率且保持市场竞争力提供了更多可能。但要实现这些目标,企业需要建立坚实的数据基础,填补当前数据管理方面的缺口。强大的数据治理不再只是IT部门的责任,而是需要管理层直接关注的战略要务。
0人