今天(13日),国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》。
什么是“数据标注”?简单理解,就是给文本、语音、图片、视频等等各种各样的数据“打标签”。本次印发的文件是国家层面首次对数据标注这一新兴产业进行系统谋划。
年均复合增长率将超20%
数据标注产业向知识密集型转变
自动驾驶、低空经济、智能制造、智慧医疗等领域都离不开数据标注。据测算,2023年我国数据标注产业规模达800亿元左右。
本次发布的《意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力水平显著提升,产业规模大幅跃升,年均复合增长率超过20%。培育壮大数据标注产业,对于推动人工智能创新发展具有重要支撑作用。
清华大学计算社会科学与国家治理实验室执行主任 孟庆国:高质量数据短缺,是我们一些大模型发展过程中遇到的瓶颈,数据标注就是对数据进行筛选、清洗、分类、标记等各种加工处理,能产生高质量的数据集,让机器读得懂、学得快、训得好。现在的一个新趋势是,数据标注自身的自动化、智能化程度也在明显提高,与此同时,细分领域变多,也需要金融、交通、能源、医疗等一些背景的专业人才,数据标注正在逐步从传统的劳动密集型向知识密集型产业转变。
《意见》还提出,建设成效显著、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态。目前,我国已确定成都、沈阳、合肥、长沙等7个城市承担数据标注基地建设任务。
突出需求牵引和创新驱动
释放公共数据、企业数据标注需求
本次《意见》从13个具体方面对培育壮大数据标注产业进行全面谋划,特别突出需求牵引和创新驱动,培育一批深耕行业的数据标注瞪羚企业、独角兽企业。
在深化需求牵引方面,《意见》首次提出释放公共数据标注需求,依法依规有序推动公共数据标注与开发利用,在现代农业、智能制造、信息服务等重点领域发掘公共数据标注需求。
清华大学计算社会科学与国家治理实验室执行主任 孟庆国:中央经济工作会议提出开展“人工智能+”行动,各个地方也在加快部署政务大模型,大模型在交通、气象、医疗等民生领域的应用会越来越多,基于公共数据的标注需求也会不断上升。如何让公共数据释放价值,一个核心工作就是做好海量公共数据的标注。
在增强创新驱动方面,《意见》中提出,完善数据标注标准,支持软硬一体、自主可控的数据标注领域技术和关键设备研发。
此外,在优化支撑体系上,《意见》中提到,加大财税金融支持力度,推动数据标注服务纳入政府采购范畴。同时推动数据标注职业体系建设,加强产业人才支撑。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有