社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
首页 > 正文
王广州:Python人口统计
文章作者:  发布时间:2019-09-19 14:46:00

 

背景:

  人口统计分析既有传统的分析方法,也有现代的分析技术。传统的分析方法往往是建立在已有汇总数据的基础上进行二次数据分析,数据分析的深度和广度取决于汇总数据提供的形式和内容。但原始个案数的分析,要求在人口统计方法创新的同时,创造自己的分析工具,充分利用现代分析技术,使研究的全过程可复制、可重复和可检验。

  大数据时代已经到来,无论是人口统计指标的构建还是人口模型的开发,都需要面对大量数据的处理问题。随着网络技术的发展,传统的人口数据源也发生了变化,人口统计学也需要充分利用不同来源的数据,与计算机发展的前沿接轨。

  Python在开发人口统计分析工具,挖掘人口数据,深入研究人口问题有着独特的优势。而免费、开源、灵活和强大的社区,也是选择Python作为开发工具的理由。

目标:

  在解决人口统计问题的同时,一方面展示人口统计研究从数据、方法到计算机工具开发的研究过程;另一方面展示从具体到规范分析流程的工具化过程。

  使研究者具备人口统计分析方法创新和计算机软件的开发的能力的重要意义在于:第一,处于学术创新的前沿;尝试新的想法,不需要借助其他专业领域的研究人员帮助;第二,处于研究的一线;随时随地对研究的细节和过程进行改进和检验,不需要借助其他研究助手辅助。

  人口统计软件开发的根本目的就是解决重复性研究工作和复杂工具的创造问题,从底层开始进行学术研究积累,创造新的研究工具。因此,本书的目标设定是为从事人口统计及相关原创性研究,开发自主独立知识产权计算机分析工具的研究者提供帮助。

内容:

  经典的人口科学研究主要研究人口的数量、结构及其变动规律和过程。任何科学研究都需要深入、细致和全面的观察。科学观察的目的是收集研究对象的基础信息。对于收集到的基础信息再进行深入的分析。人口统计分析是研究人口基础信息收集、处理方法,是人口科学研究的基础,是试图借助工具研究人口现象,总结人口特征。判断人口趋势和发现人口规律的实践活动,是研究如何处理大规模人口属性数据的方法,是人口分析技术的重要手段。

  在介绍Python人口统计分析所需语法的基础上,对人口统计分析算法、计算机程序开发和实际应用案例进行展示,试图帮助读者在人口统计方法、分析技能和计算机软件开发方面进一步提高。

  本书由11章构成,根据各章内容可以分为三类:

  第一类是Python语言介绍。Python语言的内涵非常丰富,不可能通过一章的内容介绍Python语言的全部核心内容。根据人口统计软件开发和循序渐进学习的需要,本书对Python语言的介绍仅限于本书用到的语法,并通过最简单的例子来介绍语言功能的实现和使用;

  第二类是宏观人口指标和数据分析。第二类是本书的核心构成,其中包括人口数据质量评估、生命表、人口预测、人口惯性和人口间接估计等。尽管这些章节所涉及的人口统计分析方法不同,但所有指标的构建、统计分析都是采用汇总数据,虽然分析方法有简单,有复杂,运算的数据量有大有小,但核心和思路都是处理汇总数据。

  第三类是数据库和微观人口仿真分析。第三类包括数据库使用和人口微观仿真两部分内容。数据库使用和管理是面向人口底层数据处理或大数据处理的内容。虽然数据库的种类非常繁多,功能和性能差别也比较大,但其实基本原理都大同小异。本书以开源数据库sqlite为基础,介绍数据库的使用和人口系统微观仿真的基本原理以及主要方法。

  总之,本书的三类内容相互密切联系,层层递进。后面的内容是以前面的内容为基础,因此,需要不断的反复练习和灵活掌握。

  特色:

  为了兼顾实际研究问题和基础训练两个方面,本书在讨论人口研究问题、统计分析方法和Python程序设计的同时,提供完整Python源程序和研究案例所需数据,便于读者直接使用,减少研究上的弯路。全程揭秘,模块化的程序,帮助建立最基础的框架。

拓展:

  在面向人口统计统计研究者的同时,本书力图面向更广泛的公共政策及相关领域的研究者。全书设计的内容也可作为相关研究的基础训练素材。

文章出处: