• 2025-05-18 21:05:26
  • 阅读(4289)
  • 评论(12)
  • 央视网消息:5月17日,记者从2025数据安全发展大会上获悉,我国将培育强大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将到达7.5万亿元。

    作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年,我国年度数据生产总量达41.06泽字节,同比增长25%。截至目前,我国数据领域相干企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。

    国家数据局局长刘烈宏表示,当前正谋划构建横向联通、纵向领悟,协调无力的数据基础办法体系,到2029年要基本建成国家数据基础办法主体结构。

    展开盈余 71 %

    大众数据开放同享成为数据要素市场化的紧张突破口。2024年,全国地市级以上的地方大众数据开放平台数目增长7.5%,开放数据量增长7.1%,高质量数据集数目同比增长27.4%。在数据要素与产业融合方面,国家正加快打通大众数据同享开放壁垒,推动大众数据与企业数据深度融合,激活海量“沉睡数据”。

    构建高质量数据集加速人工智能发展

    眼下,数据已超出传统生产要素,成为驱动人工智能技能突破与产业变革的核心动力。高质量数据集不但是人工智能模型性能跃升的基石,更重塑了从技能研发到商业落地的全产业链条。那高质量数据集是如何构建的?

    在浙江温州,作为全国数据要素市场化改革的“实验田”,这里构建了一套数据安全与合规体系,保证数据要素规模化流动,形成数据交易生态圈,让更多数据“活了起来”。

    技能职员告诉记者,构建大模型数据集首要包含数据采集、数据洗濯、数据标注、质量评估等核心环节。各环节需要根据大模型数据集的规模大、多样性足、行业垂直属性强等特性举行针对性的技能研发和适配。

    数据标注与洗濯是高质量数据集建设的关键环节。数据标注通过“贴标签”(如为照片标注“猫”“狗”)教会人工智能“认知世界”,未经标注的数据如同乱码教材,致使人工智能没法有效学习;数据洗濯则通过剔除重复、修正毛病等操作污染数据,混乱数据将直接影响人工智能锻炼效果。

    我国数据标注产业产值超80亿

    可以看到数据标注是高质量数据集建设的关键环节,那我国的相干产业发展情况如何呢?在2025数据安全发展大会发布的《2025高质量数据集研究报告》显示,随着人工智能、大模型技能迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、范例化发展新阶段。

    2024年,我国开发或应用人工智能的企业数目同比增长36%,高质量数据集数目同比增长27.4%,无力支撑人工智能锻炼和应用。利用大模型的数据技能企业和数据应用企业同比离别增长57.21%、37.14%。

    报告显示,当前我国正加速推动高质量数据集创新发展,但是仍然面对数据存量小产量低、数据集质量良莠不齐、缺乏主流高代价数据引领、数据利用服从高等成绩。

    45  收藏