在线性回归模型建模中, 回归自变量选择是一个受到广泛关注、文献众多,
具有很强的理论和实际意义的问题. 回归自变量选择子集的相合性是其中一个重要问题,
如果某种自变量选择方法选择的子集在样本量趋于无穷时是相合的, 而且预测均方误差较小,
则这种方法是可取的. 利用BIC准则可以挑选相合的自变量子集, 但是在自变量个数很多时计算量过大;
适应lasso方法具有较高计算效率, 也能找到相合的自变量子集; 本文提出一种更简单的自变量选择方法,
只需要计算两次普通线性回归: 第一次进行全集回归, 得到全集的回归系数估计,
然后利用这些回归系数估计挑选子集,
然后只要在挑选的自变量子集上再进行一次普通线性回归就得到了回归结果.
考虑如下的回归模型:
其中回归系数中非零分量下标的集合为,
设是本文方法选择的自变量子集下标集合,
是本文方法估计的回归系数(未选中的自变量对应的系数为零),
本文证明了, 在适当条件下,
其中表示的
分量下标在中的元素的组成的向量, 是误差方差, 是与
矩阵极限有关的矩阵和常数.
数值模拟结果表明本文方法具有很好的中小样本性质.
本文主要讨论了变点的先验分布为beta-binomial分布
和Ibrahim等(2003)提出的幂型先验的条件下, 有一个变点的线性模型的贝叶斯统计推断问题,
并且我们假定变点两边的观测值的方差是相等的.
我们得到变点、回归系数、共同方差的后要分布的显示表达式.
本论文不仅把Ferrira(1975)论文从变点先验分布服从离散均匀分布推广到了更好描述变点
的形状的beta-binomial分布, 而且进一步将变点的先验分布推广到包含的历史信息的幂型先验.
当变点的先验分布为beta-binomial分布和幂型先验时,
模拟结果显示了贝叶斯方法具有更高的准确性.