SERVICE PHONE
363050.com发布时间:2026-01-12 17:24:37 点击量:
当前,人工智能快速发展,正在重塑经济社会发展模式。2025年中央经济工作会议指出,要深化拓展“人工智能+”,完善人工智能治理。随着基础模型开源态势的形成,各方在算法层面的差距不断收窄,而数据要素价值则更加凸显,已成为人工智能竞争的核心领域。
四川应把握技术变革和产业发展新机遇,加快推动人工智能与经济社会各领域深度融合,全面激活数据要素,为全省高质量发展积蓄新动能。成都是国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,应从高质量数据供给、安全、生态、价值等多向发力,做好高质量数据集建设工作,为全省数据赋能人工智能产业高质量发展提供可资借鉴的实践经验。
海量且优质的数据是算法训练的基石。只有通过不断输入高质量数据,人工智能模型才能精准理解各类复杂场景,提升预测与决策能力,实现从理论模型到实际应用的跨越。近年来,四川省积极推进高质量数据集建设,“四川文化行业高质量数据集建设”项目入选国家数据局首批高质量数据集建设先行先试工作名单。成都市国家数据标注基地也加快建设,在新津、金牛布局专业化园区,为数据集生产提供“前端工厂”。然而,目前高质量数据集的供给与流通仍存在不少挑战。
“优质燃料”之荒——高质量数据集供给严重不足。一是高质量数据储备量低。研究机构Epoch AI发布的一份报告预测:人类生成的公开文本数据总有效存量仅约300万亿tokens,总量年增速不足10%,而AI训练数据集规模以每年翻倍的速度扩张。持续扩大的“剪刀差”可能导致互联网可用高质量文本数据面临枯竭。二是高质量数据集规模化生成难。与API等数据产品的“数据先行”传统模式不同,高质量数据集遵循“场景驱动”定制逻辑——必须围绕医疗、金融等具体行业需求进行定向开发与标注,无法通过标准化流程批量复制,从而导致供给效率低。三是原始数据质量低。受数据标准不一、采集误差等影响,大量原始数据存在分布偏差、颗粒度不一、采集缺失等状况,难以直接用于高质量数据集生产,进一步制约了有效供给。
“数据流通”之困——可信数据基础设施缺失。一是关键技术能力仍显不足。数据要素流通缺少“可用不可见、可控可计量”的可信数据空间,原始数据处理缺乏安全隔离环境和标准化工具支撑。二是机制建设存在短板。当前数据要素流通在权属界定、利益分配、合规审计等方面缺乏完善机制支撑,可信流通的“制度基座”与“操作规则”尚不健全,直接束缚了数据要素潜在价值的充分发挥。三是数据流通体系尚未形成。从数据供给、开发加工到流通应用,缺乏一体化、集约化的基础设施支撑,数据产品和数据集难以安全、高效地从供给端流向需求端,进一步限制数据要素的价值释放。
“价值闭环”之难——场景缺失与生态孤岛。一是站在需求端,企业存在“不敢供、不愿融、怕风险”情况。数据安全、个人隐私及商业秘密保护是其核心关切,担心数据流转过程中出现泄露、滥用等问题,导致数据开放意愿持续低迷。二是供给方“小而散、协同弱、转化难”。数据供给主体类型多样、规模不一,整体呈现出分散化特征。受制于数据标准不统一、专业加工能力不足、市场化运作经验有限等因素,优质数据资源难以被系统整合和规模化开发。三是有效供需对接机制和清晰的商业化路径尚未形成,导致企业“供数”动力不足,“用数”场景模糊,大量数据价值被低估、难以挖掘复用。
针对建设高质量数据集存在的供给、安全、机制等方面的问题,四川依托扎实的产业基础、丰富的创新资源与完整的产业链条,完全有能力发挥独特优势,系统破题。为此,建议四川聚焦核心问题,构建“高质量供给—可信环境—服务网络—场景激活”的系统性赋能体系,将数据高效、安全地转化为驱动产业智能化的“优质燃料”。
构建高质量可持续的数据资源供给体系。一是持续推广深化“管住一级、放活二级”数据资源开发,利用成都优势,授权符合条件的运营机构对公共数据统一开发治理、形成合规可用的基础产品,推动公共数据开放共享,激发场景化创新活力。二是要尽快完善企业数据资产确权路径,激励市场主体在合规框架内有序供给数据,鼓励企业加快实施以数据要素为关键驱动力的数字化转型,加强数据融合和汇聚,引导行业龙头企业向上下游企业开放数据资源。要大力发展智能数据标注、清洗加工等核心支撑产业,培育专业化标注平台与产业基地,提升数据治理的标准化、规模化、智能化水平。
打造“技术赋能、规则护航”的可信融合基础设施。建立融合先进技术与可信管控的数据流通基座。依托四川省成都市承担的国家数据基础设施先行先试试点任务,集成隐私计算、区块链、同态加密等先进安全技术,构建跨主体、跨行业的数据协作“技术契约”,确保流通过程全程可追溯、风险可控。在此基础上,打造形成符合国家数据基础设施互联互通标准,涵盖数据生命周期全过程,集约高效、体系兼容、安全合规的数据流通利用服务体系。例如,成都探索建设的“天府多跨数据可信流通综合服务平台”,拓展迭代升级建设“城市可信数据空间”(成都)试点,采用“两级可信开发区+生态共建平台”架构:一级区位于政务外网,负责公共数据原始数据集融合开发;二级区对接社会数据,结合经成都数据集团开发后的公共数据,以及通过“天府数据标注公共服务平台”生成的高质量数据集,依托“蓉数公园”实现场景化应用和交易流通。
培育“线上线下融合、多元主体共治”的一体化服务生态。搭建线上线下深度融合的交易服务网络,以生态化运作激活数据潜在价值。一是聚焦供需对接关键环节,汇聚安全合规服务商、质量评估机构、技术工具提供商等多元专业数商,打造功能协同、区域联动的产业服务集群。鼓励依托“蓉数公园”等区域性公共服务载体,建设线上线下融合的数据要素服务空间,面向智慧政务、医疗、应急等重点场景支持二级数商发展,并在区(市)县及重点行业设立数据要素服务站,构建起纵向贯通重点产业、横向覆盖全省的立体化数据要素服务体系。二是健全标准化、可扩展的运营服务规则体系,通过统一服务接口规范、建立透明可信的信用评价机制、推广智能高效的撮合模式和收益分配机制,提供从资源对接、合规辅导到商业落地的全周期一站式赋能。
形成“场景牵引、开放创新”的价值实现闭环。建立政府主导、平台支撑、需求牵引的场景供给与开放机制。一方面,强化政府在市场机制尚不成熟阶段的引导作用,聚焦交通、医疗、政务等公共领域,依托数字政府建设契机有序开放高价值、真实性强、紧迫性高的智能化应用场景,设立示范项目,持续释放明确的市场需求信号,牵引数据、技术与服务资源精准对接。另一方面,依托成都市民营经济发展促进中心、成都市人工智能产业生态联盟等专业化平台,深入产业一线,围绕全省制造业“智改数转”行动,系统挖掘企业在智能制造、智慧商贸、精准服务等领域的实际痛点,形成并动态发布“场景机会清单”;同步推行“揭榜挂帅”等机制,高效衔接供需两端,推动数据产品、技术工具和服务模式围绕真实需求快速迭代优化。
“人工智能+”的未来,根植于信任基座与创新生态。当安全可信的数据流通网络在四川率先成势,当协同创新的服务生态日益繁荣,高质量的数据“燃料”就能在全省产业链中顺畅奔涌,驱动一个个“智能+”场景落地生根。(作者系成都数据集团党委书记、董事长)
当前,人工智能快速发展,正在重塑经济社会发展模式。2025年中央经济工作会议指出,要深化拓展“人工智能+”,完善人工智能治理。随着基础模型开源态势的形成,各方在算法层面的差距不断收窄,而数据要素价值则更加凸显,已成为人工智能竞争的核心领域。
四川应把握技术变革和产业发展新机遇,加快推动人工智能与经济社会各领域深度融合,全面激活数据要素,为全省高质量发展积蓄新动能。成都是国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,应从高质量数据供给、安全、生态、价值等多向发力,做好高质量数据集建设工作,为全省数据赋能人工智能产业高质量发展提供可资借鉴的实践经验。
海量且优质的数据是算法训练的基石。只有通过不断输入高质量数据,人工智能模型才能精准理解各类复杂场景,提升预测与决策能力,实现从理论模型到实际应用的跨越。近年来,四川省积极推进高质量数据集建设,“四川文化行业高质量数据集建设”项目入选国家数据局首批高质量数据集建设先行先试工作名单。成都市国家数据标注基地也加快建设,在新津、金牛布局专业化园区,为数据集生产提供“前端工厂”。然而,目前高质量数据集的供给与流通仍存在不少挑战。
“优质燃料”之荒——高质量数据集供给严重不足。一是高质量数据储备量低。研究机构Epoch AI发布的一份报告预测:人类生成的公开文本数据总有效存量仅约300万亿tokens,总量年增速不足10%,而AI训练数据集规模以每年翻倍的速度扩张。持续扩大的“剪刀差”可能导致互联网可用高质量文本数据面临枯竭。二是高质量数据集规模化生成难。与API等数据产品的“数据先行”传统模式不同,高质量数据集遵循“场景驱动”定制逻辑——必须围绕医疗、金融等具体行业需求进行定向开发与标注,无法通过标准化流程批量复制,从而导致供给效率低。三是原始数据质量低。受数据标准不一、采集误差等影响,大量原始数据存在分布偏差、颗粒度不一、采集缺失等状况,难以直接用于高质量数据集生产,进一步制约了有效供给。
“数据流通”之困——可信数据基础设施缺失。一是关键技术能力仍显不足。数据要素流通缺少“可用不可见、可控可计量”的可信数据空间,原始数据处理缺乏安全隔离环境和标准化工具支撑。二是机制建设存在短板。当前数据要素流通在权属界定、利益分配、合规审计等方面缺乏完善机制支撑,可信流通的“制度基座”与“操作规则”尚不健全,直接束缚了数据要素潜在价值的充分发挥。三是数据流通体系尚未形成。从数据供给、开发加工到流通应用,缺乏一体化、集约化的基础设施支撑,数据产品和数据集难以安全、高效地从供给端流向需求端,进一步限制数据要素的价值释放。
“价值闭环”之难——场景缺失与生态孤岛。一是站在需求端,企业存在“不敢供、不愿融、怕风险”情况。数据安全、个人隐私及商业秘密保护是其核心关切,担心数据流转过程中出现泄露、滥用等问题,导致数据开放意愿持续低迷。二是供给方“小而散、协同弱、转化难”。数据供给主体类型多样、规模不一,整体呈现出分散化特征。受制于数据标准不统一、专业加工能力不足、市场化运作经验有限等因素,优质数据资源难以被系统整合和规模化开发。三是有效供需对接机制和清晰的商业化路径尚未形成,导致企业“供数”动力不足,“用数”场景模糊,大量数据价值被低估、难以挖掘复用。
针对建设高质量数据集存在的供给、安全、机制等方面的问题,四川依托扎实的产业基础、丰富的创新资源与完整的产业链条,完全有能力发挥独特优势,系统破题。为此,建议四川聚焦核心问题,构建“高质量供给—可信环境—服务网络—场景激活”的系统性赋能体系,将数据高效、安全地转化为驱动产业智能化的“优质燃料”。
构建高质量可持续的数据资源供给体系。一是持续推广深化“管住一级、放活二级”数据资源开发,利用成都优势,授权符合条件的运营机构对公共数据统一开发治理、形成合规可用的基础产品,推动公共数据开放共享,激发场景化创新活力。二是要尽快完善企业数据资产确权路径,激励市场主体在合规框架内有序供给数据,鼓励企业加快实施以数据要素为关键驱动力的数字化转型,加强数据融合和汇聚,引导行业龙头企业向上下游企业开放数据资源。要大力发展智能数据标注、清洗加工等核心支撑产业,培育专业化标注平台与产业基地,提升数据治理的标准化、规模化、智能化水平。
打造“技术赋能、规则护航”的可信融合基础设施。建立融合先进技术与可信管控的数据流通基座。依托四川省成都市承担的国家数据基础设施先行先试试点任务,集成隐私计算、区块链、同态加密等先进安全技术,构建跨主体、跨行业的数据协作“技术契约”,确保流通过程全程可追溯、风险可控。在此基础上,打造形成符合国家数据基础设施互联互通标准,涵盖数据生命周期全过程,集约高效、体系兼容、安全合规的数据流通利用服务体系。例如,成都探索建设的“天府多跨数据可信流通综合服务平台”,拓展迭代升级建设“城市可信数据空间”(成都)试点,采用“两级可信开发区+生态共建平台”架构:一级区位于政务外网,负责公共数据原始数据集融合开发;二级区对接社会数据,结合经成都数据集团开发后的公共数据,以及通过“天府数据标注公共服务平台”生成的高质量数据集,依托“蓉数公园”实现场景化应用和交易流通。
培育“线上线下融合、多元主体共治”的一体化服务生态。搭建线上线下深度融合的交易服务网络,以生态化运作激活数据潜在价值。一是聚焦供需对接关键环节,汇聚安全合规服务商、质量评估机构、技术工具提供商等多元专业数商,打造功能协同、区域联动的产业服务集群。鼓励依托“蓉数公园”等区域性公共服务载体,建设线上线下融合的数据要素服务空间,面向智慧政务、医疗、应急等重点场景支持二级数商发展,并在区(市)县及重点行业设立数据要素服务站,构建起纵向贯通重点产业、横向覆盖全省的立体化数据要素服务体系。二是健全标准化、可扩展的运营服务规则体系,通过统一服务接口规范、建立透明可信的信用评价机制、推广智能高效的撮合模式和收益分配机制,提供从资源对接、合规辅导到商业落地的全周期一站式赋能。
形成“场景牵引、开放创新”的价值实现闭环。建立政府主导、平台支撑、需求牵引的场景供给与开放机制。一方面,强化政府在市场机制尚不成熟阶段的引导作用,聚焦交通、医疗、政务等公共领域,依托数字政府建设契机有序开放高价值、真实性强、紧迫性高的智能化应用场景,设立示范项目,持续释放明确的市场需求信号,牵引数据、技术与服务资源精准对接。另一方面,依托成都市民营经济发展促进中心、成都市人工智能产业生态联盟等专业化平台,深入产业一线,围绕全省制造业“智改数转”行动,系统挖掘企业在智能制造、智慧商贸、精准服务等领域的实际痛点,形成并动态发布“场景机会清单”;同步推行“揭榜挂帅”等机制,高效衔接供需两端,推动数据产品、技术工具和服务模式围绕真实需求快速迭代优化。
“人工智能+”的未来,根植于信任基座与创新生态。当安全可信的数据流通网络在四川率先成势,当协同创新的服务生态日益繁荣,高质量的数据“燃料”就能在全省产业链中顺畅奔涌,驱动一个个“智能+”场景落地生根。(作者系成都数据集团党委书记、董事长)返回搜狐,查看更多
