互联网是媒体报道、专家意见、民众诉求表达的网络空间,存储和聚集了海量的信息内容,分析其数量、时序、来源、地域等要素,挖掘其蕴含的观点、态度、意愿、情绪等信息,有助于政府实时感知社会动态和热点关切。但互联网大数据具有来源广泛、体量大、非结构化、时效性强等特点,数据采集难度大,进而影响分析的一致性、时效性和准确性。建立自然资源领域互联网大数据采集技术规范,有利于夯实互联网大数据采集基础,为提高互联网大数据分析应用能力,提升自然资源管理和决策水平提供支撑。
2022年12月28日,自然资源部信息中心为规范自然资源领域中互联网大数据的采集,建立科学、简明、可操作的互联网大数据采集技术流程和方法,指导基于互联网大数据的信息系统建设与应用,制定《自然资源领域互联网大数据采集技术规范》(征求意见稿)。本文件规定了自然资源领域互联网大数据的来源、内容、类型和采集方法。本文件中的互联网大数据是指互联网环境下可公开获取的各类文本数据。本文件适用于各级自然资源管理部门、信息化建设单位等,用以指导在自然资源领域开展互联网大数据的采集。