依托国家数据标注基地(保定)建设,12月20日,保定启动高质量数据集评测实验室。
“在推进‘AI+’进程中,高质量数据集重要性日益凸显,不仅是训练精准高效大模型的基础,更是推动技术创新与产业升级的关键资源。”市数据局副局长郭卉介绍,高质量数据集评测实验室作为标注基地重要组成部分,将助力国家数据标注基地(保定)形成“数据标注—质量测评—市场流通”全链条生态体系。
据悉,高质量数据集评测实验室由保定市数据局,工信部五所数据治理服务中心,中国移动大数据中心、大数据拓展交付中心,莲池区人民政府,河北移动,北京海天瑞声等单位共同启动。
实验室承接数据集测评任务,为数据供需方提供全面的数据质量评估和认证服务,保障标注数据质量和可信度。数据提供方将数据集提交至高质量数据集评测实验室认证,结果将成为数据集进入市场重要参考依据。同时,数据需求方可根据高质量数据集评测实验室提供的评估结果,选择最适合其业务场景的数据集,减少模型无效训练,降低数据采购成本。
“实验室制定并实施一套全面的数据标准,以提升企业数据质量和管理效率,更好地适应不同类型和用途数据集需求。”实验室负责人、中国移动大数据中心总监伊然表示,实验室将吸引更多相关产业集聚,形成良好数字产业生态。