学术论文
杨晓蓉, 李路, 武皓月, 许文婷
本文针对一种具有广泛适用性的半参数模型,部分线性可加模型, 研究其响应变量存在删失数据时模型系数和非参数函数的估计.对此, 提出了一种基于数据增广的复合分位数回归估计方法.该方法利用分位数回归和分布函数之间的联系, 构造插补数据集,并通过迭代采用复合分位数回归得到最终的估计值. 所提方法放宽了对模型的假设,不但对迭代初始值的要求很低, 还允许响应变量同时存在多种类型的删失,具有一定的普适性. 数值模拟表明所提方法可以较为准确地估计出删失部分线性可加模型的系数和非参数函数. 实证研究中, 本文选取了北京市空气质量数据,测度了PM10浓度、CO浓度、温度、气压以及露点对PM2.5浓度的影响.结果显示, 部分线性可加模型的复合分位数回归可以较好地从线性和非线性关系两个角度来刻画这些因素对PM2.5浓度的影响,并且所提方法在删失数据的处理上表现良好.