大公网

大公报电子版
首页 > 新闻 > 内地 > 正文

培育“数据标注”巨企 国家加速AI创新

2025-01-14 05:02:27大公报
字号
放大
标准
分享

  图:图为民众在北京亦庄举行的2024世界智能网联汽车大会上参观自动驾驶汽车。\新华社

  国家发改委、国家数据局等四部门13日联合发布《关于促进数据标注产业高质量发展的实施意见》(下称《意见》),是国家层面首次对数据标注这一新兴产业进行系统谋划。《意见》提出,到2027年数据标注产业规模大幅跃升,年均复合增长率超过20%。围绕医疗健康、自动驾驶、低空经济等场景,以业务创新拉动数据标注需求,并培育一批数据标注龙头企业。

  业内专家认为,高质量数据短缺是当前人工智能(AI)大模型发展中遇到的瓶颈。数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业,能够产生高质量数据集,让机器读得懂、吃得饱,学得快、训得好,助力AI创新发展。\大公报记者 任芳颉北京报道

  聚力自动驾驶 让大模型“吃得饱”学得快

  《意见》从深化需求牵引、增强创新驱动、培育繁荣生态、优化支撑体系等方面提出具体措施,并提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。此前,我国已确定成都、沈阳、合肥、长沙等7个城市承担数据标注基地建设任务。

  《意见》从13个具体方面对培育壮大数据标注产业进行全面谋划,特别突出需求牵引和创新驱动。在深化需求牵引方面,首次提出释放公共数据标注需求,依法依规有序推动公共数据标注与开发利用,在现代农业、智能制造、信息服务等重点领域发掘公共数据标注需求。推动数据标注服务纳入政府采购范畴。在增强创新驱动方面,提出完善数据标注标准,支持软硬一体、自主可控的数据标注领域技术和关键设备研发。

  据测算,2023年我国数据标注产业规模达800亿元左右。在挖掘数据标注需求方面,《意见》指出,加大企业数据开发利用,加强交通、医疗、金融、科学、制造、农业等重点行业领域数据标注,建设行业高质量数据集,支撑人工智能在行业领域的应用赋能。围绕医疗健康、人力资源、数字贸易、自动驾驶、低空经济等场景,以业务创新拉动数据标注需求。

  支持自主可控关键设备研发

  在壮大经营主体方面,《意见》强调,培育一批数据标注龙头企业,鼓励通过资源整合、并购重组等方式做大做强,推动数据标注企业规模化、标准化、集约化发展。支持和鼓励科技创新型数据标注企业承担基础研究、技术攻关、产业应用等重点任务,提高产业链协同创新水平。培育一批深耕行业的数据标注瞪羚企业、独角兽企业。

  在开展关键技术攻关方面,《意见》特别提到,依托国家重点研发计划、国家科技重大专项等,加强跨领域跨模态语义对齐、4D标注、大模型标注等数据标注领域的关键技术攻关应用。支持多模态标注、标注审查、质量评估、基于思维链的专家标注等智能化工具研发。支持建设集数据、模型、工具、场景为一体的数据标注创新平台,推动数据标注技术融合创新。支持软硬一体、自主可控的数据标注领域关键设备研发。

  此外,在优化支撑体系上,《意见》还提到,加大财税金融支持力度,鼓励各类产业基金、专业投资机构加大数据标注产业投资力度,引导社会资本有序参与。同时加强标注人才队伍建设,制(修)定人工智能训练、数据标注相关职业国家职业标准。

点击排行