王俊、金勇进:概率-非概率调查样本的整合推断问题研究:核匹配方法

文章作者:王俊、金勇进 发布时间:2024-10-21 【小】 【中】 【大】

摘要:基于网络便利调查、大数据平台的数据收集方式,在实践中得到了广泛的发展,但获得的样本本质上均是非概率样本。利用非概率样本推断目标总体特征面临着潜在的偏差,如涵盖偏差、自我选择偏差等。近年来,对融合概率调查和非概率调查的数据资源,以估计有限总体特征问题的讨论较多,但依然存在较多问题。在已有研究的基础上,对非概率样本和概率样本均测量了辅助变量,但只有非概率样本测量了研究变量的背景下,介绍基于倾向得分框架的权数构造方法;在倾向得分核匹配方法的基础上,提出了基于融合概率和非概率样本协变量平衡的核函数带宽选择方法,为非概率样本构造倾向得分核匹配权数。模拟结果显示基于倾向得分核匹配的方法能够显著降低非概率样本的偏差,提出的融合样本协变量平衡的带宽方法能够有效减少估计量的相对偏差、绝对相对偏差和标准差。

关键词: 非概率样本;融合数据;带宽选择;统计推断;核匹配

全文阅读

文章出处:统计与信息论坛, 2024 ,39 (10)
附件下载: