
为推动高质量数据集建设,支撑人工智能产业创新发展与生态繁荣,根据《广东省政务服务和数据管理局关于公开征集高质量数据集和数据标注优秀案例的通知》,现面向全市企事业单位公开征集和遴选高质量数据集和数据标注优秀案例。有关事项通知如下。
一、征集要求
征集对象为广州市范围内具备独立法人资格的企事业单位,在信用方面无不良记录。征集案例为已建或在建的项目,并取得一定的经济社会效益。征集对象可同时申报多个征集案例。案例涉及多家单位的,可根据实际情况联合申报。
二、高质量数据集
(一)征集范围:包括但不限于科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务、医疗卫生、教育教学、商贸流通、人力资源、文化旅游、应急管理、气象服务、绿色低碳、公共安全、城市治理等重点行业领域。按照数据集的使用性质,征集类型可分为通用数据集、行业数据集、场景数据集等。
(二)数据集要求:数据集可由结构化数据、文本、视频、音频、图像等单一模态或多种模态组合构成。申报的数据集应具有较高的应用价值,可供大模型开发和训练,并支持业务应用场景落地。数据集应具备定期更新机制,符合国家数据安全与合规相关要求。
三、数据标注案例
(一)征集范围:为人工智能提供高质量数据供给,参照国家数据局关于征集数据标注优秀案例的要求,主要聚焦数据标注技术创新、行业赋能、标准应用、生态培育、人才培养等五个方向进行申报。
(二)案例要求:案例应在实际业务场景或科研项目中取得明显的应用效果,所标注的数据应切实解决了实际问题,对推动数据集建设、业务发展、提升科技水平具有显著的促进作用,且具备进一步拓展应用的潜力。鼓励与算力枢纽节点、数据基础设施、数据要素集聚发展区等进行协同联动。
四、征集程序
(一)各申报单位认真对照通知要求填写申报材料,并按属地原则向区政务和数据局提交申报材料(申报材料需同时提交可编辑版和盖章扫描的电子版)。市直事业单位和市属国企可直接向市政务和数据局提交申报材料。
其中,报送高质量数据集的,填写《广东省高质量数据集申报书》(附件1,以“单位名称+高质量数据集”命名;报送数据标注案例的,请填写《广东省数据标注案例申报书》(附件2),以“单位名称+数据标注案例”命名。
(二)各区政务和数据局积极发动辖区企事业单位申报,按照征集要求对申报材料进行初核,并于5月8日(星期四)前报送市政务和数据局。
(三)本次征集结束后有优秀案例需要申报的,可参照第四点第(一)项要求报送。
联系方式:38920075
广州市政务服务和数据管理局
2025年4月24日