长城网·冀云客户端讯(记者 牛琪)2月17日,在保定市数字保定建设推进会上,中国信息通信研究院(中国信通院)正式发布了我国首个人工智能数据集质量评估体系,标志着保定国家数据标注基地建设取得又一重大成果,该评估体系的发布将为我国数据产业、人工智能产业高质量发展提供重要支撑。
此次发布的评估体系基于“可用+好用+落地”的核心理念,创新性地提出了“CRISP-DECODE”质量评估框架,涵盖了12类一级指标,包括完整性、规范性、准确性和多样性等关键要素,并进一步细化为36类二级指标,形成了一个系统、科学、全面的质量评估体系。评估体系还具备“两项标准+一项发明专利+一套指标体系+一套系统平台”的“2+1+1+1”基础能力,有效融合了传统数据质量要求(如ISO 8000)与当前AI模型训练的实际需求,为数据管理和AI模型训练提供了强有力的技术支持和保障。
据了解,保定市自国家数据标注基地建设以来,始终聚焦各方需求,正在与中国信通院共建人工智能数据处理和质量评测中心,打造全国首个行业高质量数据集评测平台。本次评估体系的发布,标志着保定市在数据集质量评估领域迈出了重要一步。未来,该体系有望在多个行业和领域得到广泛应用,推动数据科学和人工智能技术的持续进步。