思想周刊|以高质量数据集赋能人工智能发展

新重庆-重庆日报原创 黄东东

2026-06-09 07:17

“十五五”规划纲要提出,“面向能源、交通、制造、教育、健康、金融等领域建设高质量数据集”“抢占人工智能产业应用制高点,全方位赋能千行百业”。高质量数据集是经过规范化采集、清洗标注与合规治理,具备规模充足、内容精准、结构标准、安全可控、场景适配等特征,能够有效支撑人工智能模型训练与算法创新的专业数据集合,是赋能人工智能创新发展的重要基石与关键支撑。要积极推动高质量数据集建设,持续增加数据供给,推动“人工智能+”行动赋能千行百业。

明晰高质量数据集赋能人工智能发展的价值内核。高质量数据集赋能人工智能发展的理论基础,是一个由技术基础、产业生态和国家战略构成的有机整体。一是高质量数据集是推动人工智能技术迭代升级的“核心燃料”。在人工智能技术栈中,高质量数据集是驱动人工智能技术创新能力提升的基石,决定了人工智能技术的性能。大模型已从“海量数据预训练”走向“精细化调优与推理”的发展新阶段,高质量数据集推动通用大模型向行业大模型延伸、基础算法向精准算法升级,其基础性地位已超越算力与算法,成为制约人工智能能力跃升的首要瓶颈。二是高质量数据集是完善人工智能产业生态的“重要抓手”。高质量数据集是加快“人工智能+”落地的重要支撑,是数据要素价值化的核心载体,是连接技术研发、场景应用与市场主体的关键纽带。数据价值的释放依赖于从资源到资产再到资本的转化,高质量数据集的建设、流通与应用,能够牵引数据处理、治理与交易全产业链发展。以高质量数据集建设为抓手,有效激活数据、技术、人才和资本等要素潜力,推动人工智能产业发展。三是高质量数据集是塑造人工智能核心竞争力的“关键要素”。全球人工智能竞争正从单项技术突破转向生态系统构建,以高质量数据集赋能人工智能创新发展,推动产业数据优势和应用场景规模转化为技术优势与产业生态优势。建设自主可控的高质量数据集,减少对外部数据源的依赖,降低数据偏见、安全漏洞等风险,确保关键领域人工智能应用的安全性和可靠性,保障技术自主可控与安全发展。

找准高质量数据集赋能人工智能发展的主攻方向。立足从技术突破到创新赋能的现实需求,必须破解高质量数据集“供给不足”的难题,打通高质量数据集建设的“价值闭环”,促进数据产业高质量发展。一是破解高质量数据集“供给不足”的核心瓶颈。围绕国民经济发展重点行业和战略性新兴产业,绘制数据资源图谱与需求清单,体系化拓展数据来源与规模。加大公共数据资源开发利用,建设一批基础性、普惠性的高质量数据集;发挥产业链链主企业的牵引带动作用,推动上下游企业协同共建。在工业、医疗、金融、法律等领域,发展人机协同的智能化标注技术和“专家型”标注服务,确保标注结果的专业性与权威性。二是打通高质量数据集建设的“价值闭环”。构建超越完整性和准确性的传统数据质量体系,建立涵盖场景覆盖率、标注一致性、任务适配性、伦理合规性等维度的新型数据质量标准。推动形成“物理分散、逻辑集中”的数据集资源目录与管理体系,实现高质量数据集的便捷发现、可信评估与高效调用。构建“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”,形成自我强化的正向循环。三是促进数据产业可持续健康发展。探索建立以“词元”等为基础的数据价值评估与计量体系,推动形成“为高质量数据付费”的市场共识。明确数据产权、授权运营、安全合规等基础制度,降低市场主体的合规成本与不确定性。完善数据交易、授权使用、收益分配等机制,让数据提供方、加工方、使用方合理分享价值,培育专业化服务商,提供覆盖数据全生命周期的闭环服务。

探索高质量数据集赋能人工智能发展的实施路径。把高质量数据集转化为推动人工智能发展的应用成效,需要从建设导向、供给模式、生态协同三个维度系统推进,形成可落地、可推广、可持续的实施机制。一是确立“三位一体”的建设导向,确保高质量数据集“建有所用、用有所值”。坚持问题导向,深入行业一线,识别共性痛点,以“有用才建”为原则启动高质量数据集建设。坚持价值导向,将解决特定企业问题的数据集拆解为基本数据单元,提炼行业通用的数据知识,加工成可复用的数据产品,推动从“个性案例”到“共性赋能”的规模化推广。坚持市场导向,提供基于高质量数据集的技术服务与解决方案,设计清晰可持续的价值实现机制。二是探索双轨并行的供给模式,破解数据共享与商业秘密保护的两难困境。以政府、行业协会或第三方平台牵头,针对特定行业或产业集群的共性需求,通过技术手段对数据进行脱敏、匿名化等“解耦”处理,剥离出商业秘密和个人信息,建设开放共享安全的数据市场。对于数据与核心商业秘密深度绑定,无法对外进行数据共享的龙头企业,鼓励其基于自身高质量数据集训练垂类大模型,通过开放模型API、提供智能化解决方案等形式,向产业生态内的中小微企业进行能力输出。三是打造创新联合体,构建高质量数据集赋能人工智能创新发展的生态体系。高质量数据集从建设到赋能人工智能创新发展,跨越技术研发、数据治理、场景应用、资本支持、政策保障多个环节。整合各方优势资源、构建协同创新平台,是推动机制落地的关键。要以主体联合夯实创新生态根基,推动政府、龙头企业、高校院所、数据服务商、金融机构深度联动,组建人工智能创新联合体。以链条贯通构建更有活力的创新生态,实现数据要素与智能创新深度耦合,推动创新链、产业链、资金链、人才链深度融合。

(作者系重庆邮电大学网络空间安全与信息法学院教授,本文为重庆市哲学社会科学创新工程重点项目:2025CXZD20成果)

来源: 新重庆-重庆日报  
编辑: 邱春   审核: 李露 主编:马京川     
版权声明:

凡注明来源重庆日报的作品,版权均属重庆日报所有,未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:重庆日报网”。违反上述声明者,本网将追究其相关法律责任。

除来源署名为重庆日报稿件外,其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考并自行核实。

相关新闻
网站首页| 重报集团| 关于我们| 广告业务| 联系我们

Copyright © 2000-2022 CQNEWS Corporation, All Rights Reserved.

重庆日报版权所有 未经书面授权 不得复制或建立镜像

地址:重庆市两江新区同茂大道416号 邮编:401120 广告招商:023-63907707 传真:023-63907104   违法和不良信息举报中心热线:12377

互联网新闻信息服务许可证编号50120180001 互联网出版许可证号:(署)网出证(渝)字002号  渝ICP备17015920号

渝公网安备 50011202500747号