社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
首页 > 正文
张丽萍、王广州:充分利用大数据 提升第七次人口普查数据质量
文章作者:张丽萍、王广州  发布时间:2020-05-15 12:16:00

  2020年是我国第七次人口普查年。自1953年以来,我国已经成功地进行了六次人口普查,为国家重大发展战略与规划、社会经济、生态环境等重大政策制定和科学决策提供了可靠的依据。人口普查数据质量的高低是检验一个国家综合国力、社会经济发展水平和政府执政能力的重要指示性指标。然而,做好人口普查工作始终面临人口总量、结构统计推断问题,人口重报、漏报、瞒报和基础信息申报偏差等难题的困扰,面对新的社会经济发展状况和人文环境,迫切需要重新审视人口调查的新变化、新趋势和新问题,在科学研究人口普查老问题的同时,针对人口普查新难题,前瞻性研究并提出综合解决方案和应对策略。

  第六次人口普查以来的新变化

  从2010年第六次人口普查以来,我国在社会经济环境与人口数量结构方面都发生了很大变化,对于人口基础数据除传统的需求以外,也提出了新的要求,调查技术手段等方面也发生了较大变化,其变化主要表现在以下三个方面。

  第一,大数据发展迅速,国家基础信息化工程取得成效。互联网、云计算、大数据、移动通信等信息技术以及社交媒体应用的快速发展,推动了电子政务发展模式创新,国家层面的信息化工程取得成效。以居民身份证号码为唯一标识的国家人口基础信息库覆盖全国人口,初步实现了对我国人口基础信息的统筹管理,保证了全国人口信息的一致性、准确性、完整性、权威性,解决了相关部门各自采集、重复建设、分散维护的问题,形成了全生命周期的信息管理,破解了如出生、死亡等信息的真实性、有效性难题。

  第二,城镇化进程加速,人口流动加剧。人口城镇化速度在近年来也有较快发展,城镇人口比例从2010年的49.95%提升到2018年的59.58%。2010年流动人口2.21亿人,2017年近2.45亿人,尽管流动人口在总人口中的占比有升有降,但可以预见,在今后较长一段时期,大规模的人口流动迁移仍将是我国人口发展及经济社会发展中的重要现象。此外,随着户籍制度改革和人口常住地登记制度的形成与完善,全国各地人口普查也必然面临着新的需求。

  第三,生育政策调整,一票否决以及统计指标考核对出生人口瞒报、漏报压力减弱。一孩和二孩生育数量占全部生育数量的90%以上,出生瞒报、漏报的机制发生了根本性变化,为查准出生人口总量提供了有利条件。

  人口普查面临的问题

  尽管人口普查取得了很多成就,但入户难、应答率下降和瞒报、漏报问题依然是很难解决的重大问题。人口普查面临的难题主要表现为以下几方面。

  第一, 每次普查都从头开始。由于缺少调查对象的唯一身份识别,每次人口普查都需要重新摸底登记,对已有的普查信息无法实现纵向变动和跟踪,使历次人口普查工作基础在技术层面上得不到进一步巩固和提升,影响信息资源的深入开发。

  第二, 每次普查都面临常住地确认问题。根据历次普查的结果可以发现,流动人口的重报、漏报问题还是比较严重的。为了解决重报和漏报问题,需要确定现有人口、常住人口和户籍人口调查方式以及统计口径问题,由于大量人户分离和人口迁移流动,常住人口的准确申报异常困难。

  第三, 每次普查都面临住户与住宅产权不清的问题。人口普查是住户调查,联合国曾建议,各国将人口普查和住房普查同时进行。由于人口普查与住房普查的联系特别紧密,人口普查是要查清每一处有人居住的住宅内的居住人口,很多国家采用人口和住房同时普查的方式,如1965—1979年15年间,215个国家和地区共进行了人口普查和住房普查289次,其中有205次同时进行人口普查和住房普查。然而,我国人口普查调查人口和住宅产权之间缺少唯一识别和连接。因此,调查数据对住房特征以及居住人口及其特征数据无论是时点还是时期深入挖掘都面临许多困难。

  第七次人口普查的新举措

  通过人口普查,获取我国人口的基础数据,了解人口总量结构变化的新特点,为经济社会发展提供基础信息,第七次人口普查在身份信息登记、行政数据应用以及调查方式等方面都将进行新的调整。

  第一,登记身份证号码,便于资料整合利用。与以往人口普查不同,拥有全员人口信息库将对人口普查工作的展开起到重要作用。第七次人口普查中增加了身份证号码的登记项,可以更好地利用现有信息资源,反过来也可以通过人口普查丰富人口信息系统,同时以身份证编码为关键字段,建立和完善全国人口普查结果库,便于下次普查进行数据比对,并对变化内容进行追踪。通过登记居民身份证号,把以往单次普查的数据资料盘活,既为下次普查奠定基础,同时也为行政部门的数据库资料提供更新信息。

  第二,充分利用行政数据,做好普查前的准备工作。目前行政部门已经积累了与人口相关的丰富的数据信息,如何充分利用这些数据资源成为世界各国在人口普查工作中重点考虑的问题。我国的信息化建设积累的资源在人口普查中可以加以利用,在普查前整理行政资料,并做好户口整顿,利用公安、卫健、民政、社保、房管等部门的户籍人口、流动人口、出生、死亡人口、住户资料和居住情况等信息,完善不同系统资料的整合与利用,减少数据之间的壁垒。

  第三,改进调查方式,破解入户难问题。随着城镇化进程的加速以及流动人口数量的增加,人口普查区域建筑物标绘更加复杂,入户登记阶段难度加大,增加了调查的时间和经济成本。因此,在新的技术条件下,普查小区标绘与地理信息系统结合、居民信息的网上填报,成为本次普查在数据收集方面新的亮点。

  人口普查数据深入开发的新探索

  与以往普查不同,在大数据背景下的人口普查数据不是一次性调查,要立足于普查资料的再利用,对调查内容的编码进行标准化。

  第一,建立住宅唯一代码,做好房与人的一一对应,为住房普查奠定基础。人口普查是按现住地进行登记,人口信息与住房信息是密切关联的,但住房信息在人口普查登记中并没有得到有效应用。2000年在人口普查中,首次在长表中增加了住房项目,但对于居民拥有住房的基本情况还缺少完善的登记。建议在2020年人口普查绘制普查小区环节建立住房的唯一编号,做好标准化的详细地址记录,并在人口普查入户登记中使用这一编号,便于准确掌握全国城乡的住房状况,从国家层面掌握所有公民的住房居住情况,对进一步完善住房制度、制定住房政策具有重要意义。

  第二,做好电子数据归档,加强后期数据深入开发。作为人类文明和科学遗产的重要组成部分,世界许多国家对人口普查数据的保存、开发利用都是非常重视的,既有完备的法律制度,也有科学的保存方法。人口普查比较发达和先进的国家,即便是一些几十年前甚至上百年前获得的原始数据也会随着科学技术的发展,不断地被有效归档保存和深入开发利用,不会由于技术的发展、制度的变迁和政权的更替而发生损毁或遗失。我国已经成功地进行了六次人口普查,成为科研以及政府决策部门宝贵的资料,除人口普查汇总资料外,人口原始数据以及与普查相关的调查资料的保存是对数据资料更好利用的前提。所以,必须做好现有普查数据归档,并建立普查数据名录库。如果本轮普查建立了完整的住房与人员名录库,那么,将会为下一轮人口普查工作方式的改变奠定更好的数据基础。同时,按照国际惯例,提供有代表性的原始抽样数据供科学研究者进行长期、深入的开发研究。

  总之,第七次人口普查方案的确定以及普查工作指挥框架系统和普查系统开发与测试均已经在进行之中,人口普查工作也进入综合试点阶段,这项工作不仅仅是统计部门的日常工作,也是学界进行学术研究、政府管理部门进行相关规划的基础。在新技术发展的背景下,更好地开展新一轮的人口普查也为民众所期待。

文章出处:中国社会科学报,2020年5月14日,第1925期