基于估计稳定性的变系数模型选择

       摘要: 变系数模型是一类非常重要的非参数回归模型,由于它考虑了指标变量与协变量之间的交互效应,与常规的线性模型相比具有更强的适应性和解释能力.变系数模型的变量选择方法有很多,目前应用较多的是CV、BIC、AIC等.这些方法不同程度地出现了模型选择不稳定的问题,而这一问题在高维数据分析中更加明显.文章将基于估计稳定性的ESCV方法作为一种选参准则应用到变系数模型选择中,以期提高变系数模型的稳定性.选用模型预测均方误差、模型大小以及显著性变量个数及其百分比来度量模型的稳定性.在变系数模型KLASSO估计下,比较ESCV选参准则与传统的BIC准则在这四个指标上的表现.模拟实验和实际数据分析都验证了新方法的优越性.

作者:
吕晓玲 刘撷芯 戴秀红
单位:
中国人民大学应用统计研究中心,北京100872;中国人民大学数据挖掘中心,北京100872;中国人民大学统计学院,北京100872 中国人民大学统计学院,北京,100872
出处:
《统计与决策》
刊期:
2018年第34卷第5期
基金:
国家自然科学基金资助项目

基于估计稳定性的变系数模型选择

摘要: 变系数模型是一类非常重要的非参数回归模型,由于它考虑了指标变量与协变量之间的交互效应,与常规的线性模型相比具有更强的适应性和解释能力.变系数模型的变量选择方法有很多,目前应用较多的是CV、BIC、AIC等.这些方法不同程度地出现了模型选择不稳定的问题,而这一问题在高维数据分析中更加明显.文章将基于估计稳定性的ESCV方法作为一种选参准则应用到变系数模型选择中,以期提高变系数模型的稳定性.选用模型预测均方误差、模型大小以及显著性变量个数及其百分比来度量模型的稳定性.在变系数模型KLASSO估计下,比较ESCV选参准则与传统的BIC准则在这四个指标上的表现.模拟实验和实际数据分析都验证了新方法的优越性.

说明:如本页面涉及到版权问题或作者不愿意公开,请联系本站管理员删除!

0.337512s