蚂蚁数科发布DataX平台,MCP协议重塑数据生态

产品更新

蚂蚁数科在第九届数字中国建设峰会上正式发布 DataX 智能体数据生态平台,通过接入模型上下文协议(MCP)和专业智能体 DTClaw,构建三层数据智能架构,大幅降低数据接入门槛,加速数据要素价值释放。

蚂蚁数科发布 DataX 智能体数据生态平台,接入 MCP 协议重塑数据生态格局

4 月 28 日至 29 日,第九届数字中国建设峰会在福州举行。蚂蚁数科在峰会期间正式发布 DataX 智能体数据生态平台,标志着其 "Data+AI" 战略进入全新阶段。

蚂蚁数科 DataX 智能体数据生态平台发布现场全景图

一、背景:数据要素从"可流通"迈向"可信智能流转"

过去几年间,数据要素市场在政策推动和技术演进下快速发展。从 2022 年"数据二十条"发布,到各地数据交易所陆续建立,数据的确权、流通与合规治理体系逐步完善。然而,一个核心矛盾始终存在:数据流通的基础设施日趋完善,但数据真正转化为业务价值的"最后一公里"仍然漫长

企业在实际使用数据时,往往面临以下困境:

  • 数据接入成本高:不同来源的数据格式各异,接口标准不统一,企业需投入大量人力进行适配和清洗
  • 数据加工链路长:从原始数据到可用的数据产品,需要经历采集、清洗、建模、验证等多个环节,周期动辄以月计
  • 数据应用门槛高:缺乏专业数据团队的中小企业,往往只能"看着数据用不起"
  • 数据安全合规压力大:越有价值的数据往往越敏感,数据融合和跨域使用面临严格的隐私保护要求

随着 2025 年以来大模型技术的加速成熟,单纯的数据流通已不足以释放数据的完整价值。数据需要与 AI 的分析、推理、决策能力深度结合,才能真正转化为企业可感知、可落地的应用成果。正是在这一背景下,蚂蚁数科在刚刚举行的第九届数字中国建设峰会上,正式推出了 DataX 智能体数据生态平台。

二、DataX 平台全面解析:三层架构驱动数据智能

2.1 平台定位与核心理念

DataX 并非一款简单的数据管理工具,而是一个面向数据要素全生命周期的智能体数据生态平台。蚂蚁数科在发布中明确了 DataX 的核心定位——构建 "行业数字员工 + 数据应用加工厂 + 数据能力市场" 的三层架构,通过技术手段打通数据从"沉睡资产"到"智能应用"的完整链路。

具体而言,三层架构的分工如下:

层级 名称 核心功能 目标用户
上层 行业数字员工 封装行业实践为可直接调用的智能体,支持自然语言交互 业务人员、决策者
中层 数据应用加工厂 提供数据加工、建模、验证的全链路自动化能力 数据工程师、开发者
底层 数据能力市场 汇聚隐私计算、数据运营等标准化能力组件,支持按需调用 平台生态伙伴

这一架构设计的核心思路在于:让不同角色的用户都能在自己的能力范围内高效使用数据。业务人员不需要理解底层的数据处理逻辑,只需通过自然语言与"数字员工"交互即可获取所需洞察;数据工程师则可以在加工厂层面进行更精细的数据操作;而生态合作伙伴可以将自身的数据能力发布到市场,形成正向循环的数据生态。

2.2 关键技术一:模型上下文协议(MCP)接入

本次发布中最具技术含量的亮点之一,是 DataX 平台在技术底层全面接入了模型上下文协议(Model Context Protocol,简称 MCP)

MCP 是近期在 AI 领域备受关注的一项开放标准协议,它的核心目标是为 AI 模型与外部数据源、工具之间的交互定义一套统一的接口规范。简单来说,MCP 之于 AI 模型,就好比 USB 之于计算机——它提供了一个标准化的"插口",让不同来源的数据和工具能够以统一的方式被 AI 模型调用和理解。

在 DataX 平台中,MCP 的接入带来了以下关键价值:

  • 数据服务标准化:传统的数据服务往往以 API、文件传输等多种形式存在,接入成本高且维护复杂。DataX 将这些异构数据服务统一转换为符合 MCP 标准的协议接口,AI 模型可以直接读取和理解数据的上下文信息,无需额外的适配层
  • AI 接入效率大幅提升:开发者无需为每个数据源单独编写连接器,只需通过 MCP 协议即可实现数据的快速接入和调用,接入周期从"周级"缩短到"小时级"
  • 跨平台互操作性:MCP 的开放标准特性意味着 DataX 上的数据能力可以被各类支持 MCP 协议的 AI 应用无缝调用,打破了数据孤岛

这一技术选择体现了蚂蚁数科对 AI 生态发展趋势的判断:在智能体(Agent)即将成为 AI 应用主流范式的背景下,数据服务需要从传统的"被动调用"模式转变为"主动适配 AI"模式。接入 MCP 正是这一转变的关键一步。

2.3 关键技术二:DTClaw 专业智能体

除了 MCP 协议,DataX 平台的另一项核心能力来自其内置的专业智能体——DTClaw(DataClaw)。

DTClaw 的设计理念可以用一句话概括:将复杂的数据处理逻辑与行业最佳实践封装为可直接调用的 Skill(技能)和 Agent(智能体),实现数据的"开箱即用"

在传统的数据处理流程中,一个完整的数据分析任务往往需要经历以下步骤:

  1. 确定数据需求和业务场景
  2. 寻找并接入相关数据源
  3. 进行数据清洗和预处理
  4. 选择合适的分析模型或算法
  5. 执行分析并验证结果
  6. 将结果转化为业务可理解的形式

这一流程通常需要数据工程师、数据分析师和业务专家的协同配合,耗时长且容易出错。DTClaw 的目标是将其中可标准化的环节尽可能自动化。

具体而言,DTClaw 智能体提供了以下能力:

  • Skills 库:DataX 平台汇聚了涵盖隐私计算、数据加工、数据运营、数据应用等多个领域的 Skills 库。每个 Skill 都是一个封装好的数据处理能力单元,可以被智能体直接调用
  • 智能编排:通过自然语言描述需求,DTClaw 可以自动从 Skills 库中选取合适的能力组件,编排成完整的数据处理流程
  • 行业实践封装:DTClaw 将金融、政务、交通、能源等行业的数据处理经验沉淀为标准化的 Agent,企业无需从零开始积累行业 know-how

2.4 图谱知识库与自然语言交互

DataX 平台的第三项核心能力是其构建的基于数据的图谱知识库

这一知识库并非简单的数据目录或文档索引,而是将数据资产、数据关系、行业知识、处理经验等多维信息以知识图谱的形式进行结构化组织。在此基础上,平台支持用户通过自然语言进行两类核心操作:

  • 数据应用的智能编排:用户可以用自然语言描述自己的数据需求,例如"我需要分析过去三个月的用户留存趋势,并考虑地域分布因素",平台会自动匹配相关数据源、选择合适的分析方法,并编排出完整的处理流程
  • 数据知识的高效检索:用户可以用自然语言查询数据资产的相关信息,例如"哪些数据集包含用户消费行为信息?""这个数据集的更新频率和覆盖范围是什么?",平台会从知识图谱中精准检索并返回结果

这一能力对于企业在数据业务场景中快速构建专业智能体具有重要意义。传统的智能体开发往往需要大量的数据标注和规则配置工作,而基于图谱知识库,企业可以大幅缩短智能体的开发周期,让更多业务场景快速享受到 AI 带来的效率提升。

三、产业生态视角:DataX 的战略意义

3.1 "Data+AI" 战略的关键拼图

本次峰会是蚂蚁集团首次以 "Data+AI" 为核心命题,系统呈现其在数据智能领域的全栈技术布局。DataX 平台正是这一战略中的关键拼图。

从蚂蚁集团整体业务版图来看,DataX 与以下业务板块形成了明确的协同关系:

  • OceanBase 数据库:作为数据存储和管理的底层基础设施,OceanBase 为 DataX 提供高性能、高可靠的数据支撑。OceanBase 目前已服务政务、金融、交通、能源等领域超 4000 家客户,日处理数据量以十亿级计
  • 蚂蚁密算(隐私计算):DataX 平台中的隐私计算 Skills 正是基于蚂蚁密算的"可信智能 Fabric"架构,支持敏感数据在全程加密环境下完成融合加工和智能决策。目前密态计算性能开销已降低到仅为明文计算的 1.21 倍
  • 蚂蚁数科 Agentar 智能体开发平台:Agentar 提供的全栈智能体开发能力,与 DataX 的数据生态能力形成互补,共同构建从数据到智能体的完整链路

3.2 对数据要素市场的影响

DataX 平台的发布对于整个数据要素市场具有示范意义。其核心价值在于提供了一种从数据资源到数据产品再到智能应用的标准化路径,这对于当前仍处于探索期的数据要素市场化配置改革具有重要参考价值。

特别值得关注的是,DataX 通过"DataClaw+X"的模式实现数据智能应用的快速封装与开放集成,并链接全国高质量政务与行业数据。这意味着平台不仅服务于单个企业的数据需求,更致力于构建一个跨机构、跨行业的数据智能生态

在政务领域,这一模式已经展现出明确的应用前景。峰会期间展示的多个案例表明,基于 DataX 类似的数据智能能力,政务场景中的"一网统管""秒批秒办""政策找人"等智能化落地正在加速。

3.3 MCP 协议生态的产业机遇

从更宏观的视角来看,蚂蚁数科选择在 DataX 平台中全面接入 MCP 协议,也为国内 MCP 生态的发展注入了新的动力。

自 MCP 协议发布以来,全球范围内已有越来越多的 AI 工具链和数据平台开始支持这一标准。蚂蚁数科作为国内数据科技领域的头部企业,其对 MCP 的采用具有明确的示范效应。可以预见,随着 DataX 平台的推广和落地,将会有更多的数据服务提供商和 AI 应用开发者加入 MCP 生态,推动国内数据与 AI 互操作标准的统一。

四、技术趋势与行业展望

4.1 智能体时代的数据平台演进

DataX 的发布折射出数据平台领域的一个重要演进方向:从传统的"数据仓库/数据湖"范式向"智能体原生数据平台"范式的转变

在传统范式下,数据平台主要解决数据的存储、计算和查询问题,用户(通常是数据工程师或分析师)需要主动编写 SQL 或配置 ETL 流程来获取所需数据。而在智能体原生的新范式下,数据平台需要能够:

  1. 被 AI 智能体自主发现和调用——这正是 MCP 协议解决的问题
  2. 将数据处理能力封装为可组合的原子单元——这是 Skills 库的设计理念
  3. 支持基于自然语言的数据编排和检索——这是图谱知识库的核心价值
  4. 在保证安全合规的前提下支持跨域数据融合——这是隐私计算能力的关键作用

可以说,DataX 平台在这四个维度上都给出了自己的解决方案,其整体设计思路代表了数据平台领域的前沿方向。

4.2 Data+AI 融合的三大趋势

结合本次峰会的整体动态和行业发展情况,我们可以观察到 Data+AI 融合的三大趋势:

趋势一:数据服务的"智能体化"

传统的数据服务以 API 或报表形式交付,未来将越来越多地以智能体形式呈现。用户不再需要理解数据结构和查询语法,而是通过与智能体的自然语言交互即可获取数据洞察。DataX 的"行业数字员工"正是这一趋势的具体体现。

趋势二:数据处理的"自动化/自主化"

从传统建模需要"月级"周期,到 DataX 支持的"小时级"交付,再到钱塘征信展示的"最短 6 小时"自动建模,数据处理的自动化程度正在快速提升。未来,基于 AI 的自主数据处理将成为常态,人类专家更多扮演监督和决策角色。

趋势三:隐私计算成为数据融合的"标配"

随着数据安全法规的日趋完善和企业数据安全意识的提升,隐私计算正从"可选项"变为"必选项"。蚂蚁密算展示的密态计算性能(仅为明文计算的 1.21 倍开销)表明,隐私计算的性能瓶颈正在被突破,大规模商用的条件日趋成熟。

4.3 企业应对建议

对于正在推进数字化转型和数据战略的企业而言,DataX 平台的发布以及本次峰会展现的 Data+AI 趋势,有以下几点值得关注:

  • 关注 MCP 协议生态:如果企业正在建设或规划数据服务能力,建议关注 MCP 协议的发展动态,评估将自身数据服务适配 MCP 标准的可行性和价值
  • 评估智能体数据平台:对于数据团队规模有限但数据需求旺盛的中小企业,DataX 这类智能体数据平台可能是一条值得探索的"弯道超车"路径
  • 重视隐私计算能力建设:在跨域数据融合需求日益增长的背景下,提前布局隐私计算能力将为企业在数据合作中赢得更多机会
  • 培养 AI 原生的数据人才:传统的数据工程师和分析师需要拓展 AI 相关技能,能够理解和使用智能体工具进行数据处理和分析

五、总结

蚂蚁数科在第九届数字中国建设峰会上发布的 DataX 智能体数据生态平台,是其 "Data+AI" 战略的一次重要落子。通过接入模型上下文协议(MCP)、引入 DTClaw 专业智能体以及构建图谱知识库,DataX 平台试图解决数据从"可流通"到"可智能应用"的核心痛点。

从产业角度来看,DataX 的"行业数字员工 + 数据应用加工厂 + 数据能力市场"三层架构,以及其对 MCP 开放标准的采用,为数据要素市场的发展提供了一条值得参考的技术路径。在智能体(Agent)即将成为 AI 应用主流范式的背景下,让数据服务主动适配 AI、让数据"开箱即用",将是数据平台竞争的关键维度。

我们将持续关注 DataX 平台的实际落地情况和 MCP 协议在国内的生态发展,为读者带来后续的深度报道和技术解析。


参考来源

  1. 蚂蚁数科亮相 2026 数字中国建设峰会,推出 DataX 智能体数据生态平台 - IT之家 — IT之家对本次发布的详细报道,包含 DataX 平台核心技术细节和功能介绍