现代生命表分析技术及应用研究新进展--从计算方法到软件开发

发布时间:2024-07-01 【小】 【中】 【大】
项目主持人:王广州
项目来源/分类:国家社科基金后期资助
项目主要内容:
目前,我国定量社会科学研究过程中,很多研究都是使用国外统计软件,很少有对软件的算法、原理甚至存在的缺陷进行校验,不了解软件的细节和过程,因此,对研究方法本身的理解还存在一些差距,甚至一知半解,在这种情况下,很难进行深入的原创性研究。此外,在人口统计问题的研究过程中,过分地依赖国外统计分析软件,存在为了方法而方法,通过所谓的“方法”和“技术”掩盖研究的无意义或对研究问题的一知半解。
针对人口统计学的核心研究问题和研究过程中存在的问题,本项研究的主要内容聚焦在以下几个方面:
第一方面为计算机语言。任何计算机语言都是一个比较庞大的系统,但并不是所有功能都会同时用到特定的软件开发过程中。针对不同的研究目标,所需技术解决方案不同,因此,涉及计算机语言的内容也不同。为了缩短从算法到软件的学习路径,提升从人口科学研究到软件开发的效率,本项研究有关计算机语言内容使用的原则是尽可能限定在必须的范围内。一方面降低学习难度;另一方面使研究者的精力集中在熟练解决相关研究问题上。基于以上原则和思路,本项研究对计算机语言的介绍主要有四部分内容。第一部分是C++语法;第二部分是计算机软件的界面设计;第三部分是数据库处理;第四部分为软件的打包和安装文件制作。
第二方面为生命表算法与软件开发。从基础数据来看,生命表分析技术内容包括基于汇总数据的生命表构建方法和基于原始个案数据的生命表数据挖掘方法;从生命表的类型来看,有单递减生命表和多状态生命表。比如,单递减生命表既可以从汇总数据出发,也可以从原始个案数据出发,因此,在研究过程中,数据处理方式和软件设计是有很大差别的。此外,为了面向大数据分析,增加了人口数据库的分析和比较复杂的基础数据处理,比如家庭人口研究内容和软件设计方法,为人口系统的微观人口仿真、婚姻家庭生命表等分析技术奠定基础。
第三方面为生命分析技术应用。虽然生命表分析技术起源于研究平均预期寿命问题, 但许多人口的社会、经济问题可以转换为状态转换的研究问题,也是就是可以作为稳定性测量的重要方法,因此,应用范围还是非常广泛的。本项研究的重点集中在就业、健康的多状态生命表分析技术的应用问题,以中国劳动年龄人口就业、健康状态变化为例,在研究中国人口经济、社会问题的过程中,展现平均预期寿命预测和多状态生命表的应用算法和软件设计方法。
总之,本项研究的内容选择上力图兼顾人口科学研究创新、软件开发和实际应用研究三个重要方面的有机联系以及分析技术实现的细节,使研究的全过程具有可复制、可重复和可工具化的特征,为进一步的人口科学研究创新提供参考。
 
项目起止时间:2023年11月14日-2026年11月14日
 
附件下载: