阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 综述报告
    储嘉诚, 唐炎林
    应用概率统计. 2023, 39(3): 455. https://doi.org/10.3969/j.issn.1001-4268.2023.03.010
    我们对高维线性模型统计推断近年来发展的一些结果进行了综述. 我们介绍了三种主要的纠偏LASSO估计的思想与方法,这些纠偏LASSO估计具有渐近正态性, 因此可以对低维系数进行统计推断. 此外,我们也对基于纠偏LASSO进行bootstrap抽样的同时推断方法做了简单介绍.
  • 学术活动报道
    应用概率统计. 2023, 39(2): 315.
  • 学术论文
    吴臻, 张德涛
    应用概率统计. 2023, 39(3): 413-435. https://doi.org/10.3969/j.issn.1001-4268.2023.03.007
    本文从随机微分方程和倒向随机微分方程基本理论和应用背景谈起, 结合随机最优控制理论和金融市场中的期权定价理论导出完全耦合的正倒向随机微分方程的形式. 进而从该类方程的可解性这一角度出发,对已有的理论方法进行分析和探讨,引入一种非马尔科夫框架下保证解的存在唯一性的``统一框架''方法,给出比较定理、解的高维估计等重要性质,并联系相关偏微分方程系统给出其概率解释. 对实际中应用广泛的线性正倒向随机微分方程引入了一种线性变换的方法作为``统一框架''方法的重要补充和完善,使得正倒向随机微分方程的应用更加广泛.
  • 学术论文
    张应应, 荣腾中, 李曼曼
    应用概率统计. 2023, 39(2): 159-177. https://doi.org/10.3969/j.issn.1001-4268.2023.02.001
    所提出的幂幂损失函数对参数过大或过小具有均衡收敛速度或惩罚, 具有本文列出的所有七个性质, 因此建议用于正限制参数空间.然后在幂幂损失函数下计算参数的贝叶斯估计量、后验风险、综合风险和贝叶斯风险.接着, 我们在一个分层正态--正态逆伽玛模型下解析地计算了这些量. 最后,数值模拟验证了我们的理论研究.
  • 学术论文
    刘志伟, 夏志明
    应用概率统计. 2023, 39(2): 218-238. https://doi.org/10.3969/j.issn.1001-4268.2023.02.004
    鉴于传统的神经网络可解释性差且同时概括数据全局趋势和局部变化的能力有限, 其不适合直接用于估计部分线性模型的回归函数.针对该问题, 本文首先构建了同时具备线性部分和非线性部分的半线性神经网络结构,其次在一些必要条件下证明了基于经验风险最小化的网络估计量的相合性,并设计了基于梯度下降的半线性网络参数估计算法-----局部反向传播算法.随机模拟实验验证了大样本性质,实例分析结果说明了对于此问题在神经网络中引入线性部分的必要性, 特别地,实验表明在波士顿房价数据集上该方法估计效果略优于N-W核估计方法.
  • 学术论文
    米辉, 狄文荣, 林金官
    应用概率统计. 2023, 39(2): 239-258. https://doi.org/10.3969/j.issn.1001-4268.2023.02.005
    本文研究了利率由Vasicek过程描述,两类保险业务具有相依风险的最优投资和再保险模型.盈余过程由扩散近似模型刻画, 保险人的目标是在给定期望终端财富的情况下,寻找使得终端财富的方差最小的投资和再保险策略.通过使用随机线性二次最优控制理论, 建立Hamilton-Jacobi-Bellman (HJB)方程,我们获得了值函数的精确表达式以及最优投资和再保险策略. 另外,我们给出了有效策略和有效前沿. 最后,通过数值例子说明了模型参数对最优投资和再保险策略的影响.

  • 学术论文
    时炎杰, 彭秀云, 刘文博
    应用概率统计. 2023, 39(3): 317-332. https://doi.org/10.3969/j.issn.1001-4268.2023.03.001
    考虑具有两个相互关联的竞争失效机理导致部件失效的k/n系统可靠性问题, 关联性由Gumbel-Barnett (GB) Copula连接,边缘分布为尺度和形状参数不同的Weibull分布.研究了GB Copula对部件和k/n系统失效率和可靠度的影响.证明了当边缘分布形状参数相等时, 在不同取值下,部件对应单调递增、单调递减和浴盆状失效率.模拟发现k/n(n>1)系统可靠度并不一致优于简单系统(即k/n=1/1).基于逐步II型截尾样本, 讨论了k/n系统参数和可靠度的Bayes估计,并进行了Monte Carlo试验与分析. 最后,提供了一个实例演示本文构建的模型和提出的方法.
  • 学术论文
    杨雯婉, 袁程
    应用概率统计. 2023, 39(3): 449-454. https://doi.org/10.3969/j.issn.1001-4268.2023.03.009
    本文给出了一类加权的第二Borel-Cantelli引理.这是对以前该引理的两种推广的一个补充.
  • 学术论文
    张寅秋, 吕广迎, 焦君君
    应用概率统计. 2023, 39(3): 333-346. https://doi.org/10.3969/j.issn.1001-4268.2023.03.002
    本文主要研究了环境污染下的Lotka-Volterra随机捕食模型. 得到了周期解的存在性和全局吸引性. 更进一步,我们给出了非平凡正周期解存在以及全局吸引性的充分条件. 最后,数值模拟验证了我们的结果.
  • 彭文杰, 李育强,
    应用概率统计.
    录用日期: 2023-06-16
  • 学术论文
    焦君君, 程维虎
    应用概率统计. 2023, 39(2): 178-196. https://doi.org/10.3969/j.issn.1001-4268.2023.02.002
    本文讨论了当系统的强度和系统所受的应力服从独立的、不同的二项式指数~2~分布时系统的可靠性问题. 采用了不同的方法来估计可靠性.在估计过程中使用了极大似然ML方法、基于Wilson-Hilferty(WH)的正态近似方法和贝叶斯方法. 同时, 基于正态近似方法、贝叶斯法和Bootstrap法(Boot-p和Boot-t)提出了应力--强度可靠度的置信区间.通过蒙特卡罗模拟比较了不同的方法和相应的置信区间. 最后,给出了一个真实数据集的分析进行说明.
  • 学术论文
    刘宣, 马海强
    应用概率统计. 2023, 39(4): 475-490. https://doi.org/10.3969/j.issn.1001-4268.2023.04.001
    本文研究了解释变量为过程, 响应变量为标量的函数型线性回归模型的变点检验问题. 基于投影矩估计量, 在截断的有限维空间上, 论文给出了检验统计量和变点估计量, 获得了检验统计量的渐近分布, 并在一定的条件下证明了变点估计量的相合性. 数值模拟和实际数据分析呈现了所提方法的有限样本表现.
  • 学术论文
    程恭品, 王清华, 姚定俊
    应用概率统计. 2023, 39(2): 283-300. https://doi.org/10.3969/j.issn.1001-4268.2023.02.007
    随着我国人口老龄化程度不断加深,针对老年人的长期护理保险的定价方法成为保险精算方向的热点问题.本文利用中国老年健康影响因素跟踪调查(CLHLS) 2014--2018年的数据,在传统的三、四状态马尔科夫模型的基础上,进一步将老年人的健康状况划分为六种状态,采用马尔科夫模型对各状态进行数值测算,利用Robinson幂函数综合考虑了性别和年龄两种因素求解健康状态的转移强度矩阵和转移概率矩阵, 随后运用双随机Lee-Carter模型、随机游走模型和预期寿命公式估算了65、75和85岁的保费年限,以此为依据给出了长期护理保险的保费计算方法,为我国的长期护理保险定价提供理论参考.
  • 邓文丽, 王黎明, 王静龙,
    应用概率统计.
    录用日期: 2023-06-16
  • 学术论文
    潘莹丽, 徐凯东, 陈慧芳, 刘展
    应用概率统计. 2023, 39(3): 394-412. https://doi.org/10.3969/j.issn.1001-4268.2023.03.006
    在流行病学、生物医学和临床试验等领域的研究中,Cox模型是最受欢迎的半参数回归模型之一. 在建模过程中,观测到的协变量通常是被污染的, 污染因子可测, 但是污染函数未知,直接使用被污染的协变量进行参数估计, 可能会造成错误的统计推断.研究者往往发现疾病治疗的最佳时刻点, 如果忽略这些辅助生存信息,可能导致估计效率的降低.本文研究带有污染协变量和辅助生存信息的Cox模型的一种改进估计,通过核平滑方法校准受污染的协变量, 并通过分组提取辅助生存信息用于参数估计,然后使用广义矩估计方法解决超维方程组求解的问题.模拟分析和实证研究结果表明:基于协变量校准后的Cox模型的广义矩估计方法比偏似然估计方法、协变量未调整
    的Cox模型的广义矩估计方法的效果更好.
  • 张芸芝, 王晓迪, 陈雪平,
    应用概率统计.
    录用日期: 2023-06-16
  • 学术论文
    谢佳益, 张志民
    应用概率统计. 2023, 39(2): 197-217. https://doi.org/10.3969/j.issn.1001-4268.2023.02.003
    本文研究了带有障碍分红策略的复合泊松风险模型下的破产赤字折现密度函数的统计估计.在索赔次数过程的泊松强度和个人索赔大小的密度函数均未知的情况下,我们运用COS方法构造了估计值, 并且推导出了估计值的一致性. 此外,在样本量有限情况下, 我们提供的仿真结果验证了此统计估计方法的有效性.
  • 学术论文
    周豪, 彭幸春
    应用概率统计. 2023, 39(3): 363-382. https://doi.org/10.3969/j.issn.1001-4268.2023.03.004
    本文研究了部分信息下带有保费返还条款的DC养老金的时间一致性投资策略. 假设养老金管理者只拥有股票的部分信息,即只能观测到股票的价格, 而不能观测到股票的收益率. 养老金带有保费返还条款,在基金累积期死亡的参与者可以获得前期缴纳的所有保费. 此外,本文还考虑了通胀风险以及随机工资. 首先, 利用卡尔曼滤波理论,将部分信息情形下的最优投资组合问题转化为一个完全信息情形下的问题.然后, 通过求解一个扩展的HJB方程, 得到时间一致性投资策略和最优值函数,并给出了均值--方差有效前沿的参数表达式.最后, 用蒙特卡洛方法进行数值模拟,分析了部分信息和保费返还条款对股票投资比例和有效前沿的影响,并给出了相应的经济学解释.
  • 学术论文
    章溢
    应用概率统计. 2023, 39(2): 301-314. https://doi.org/10.3969/j.issn.1001-4268.2023.02.008
    期望效用保费定价方法是保费定价的重要方法之一.本文建立了期望效用保费原理的贝叶斯模型, 定义了期望效用原理的风险保费,并给出了风险保费的信度估计. 进而, 研究了保费估计的统计性质.最后通过数值模拟的方法验证了风险保费估计的渐近正态性和收敛速度.
  • 学术论文
    温利民, 韩菲
    应用概率统计. 2023, 39(3): 347-362. https://doi.org/10.3969/j.issn.1001-4268.2023.03.003
    追溯保费是一种依赖于保单期保险人实际损失的保费厘定计划, 是对过去已经发生的损失进行承保的保险方式.本文将追溯保费应用于再保险模型中,当最优准则选为最小化风险调整值而风险资本用TVaR来度量时,得到的最优分保函数形式为停止损失再保险. 进而,
    研究了最优停止损失再保险中最优自留额的求解算法. 最后,假设损失服从指数分布、Pareto分布和Gamma分布等情形,利用数值举例的方法研究了税租乘数T和安全负荷系数\rho对最优自留额和最小风险调整值的影响. 结果表明, 当其他参数一定时,T增大, 最优自留额增大而最小风险调整值减小; 而其他参数一定时,最优自留额和最小风险调整值都会随着\rho的增大而增大.
  • 学术论文
    杨昕, 杨善朝, 邢国东, 杨秀桃
    应用概率统计. 2023, 39(3): 383-393. https://doi.org/10.3969/j.issn.1001-4268.2023.03.005
    资产价格的波动性是学者们十分关注的重要研究课题. 近年来, 学者们提出了许多波动率的估计方法, 并研究了估计量的相合性和渐近正态性. 本文重点研究了Kristensen\ucite{26}提出的NW型瞬时波动率核估计,指出其证明过程中存在的一些错误,并在合理的条件下进一步推导了估计量的强相合性和一致强相合性.
  • 概率统计资深学者传略
    徐钟济, 袁卫
    应用概率统计. 2023, 39(6): 924-940. https://doi.org/10.3969/j.issn.1001-4268.2023.06.010
  • 学术论文
    温馨, 徐小雅, 郭先平
    应用概率统计. 2023, 39(4): 589-603. https://doi.org/10.3969/j.issn.1001-4268.2023.04.009
    本文研究一类非平稳离散马氏决策过程的风险概率最小化问题, 其中转移概率和奖励函数随时间变化.与现有文献中的期望报酬/成本准则不同, 本文考虑最小化系统在首次到达某个目标集之前获得的总报酬未能达到给定利润目标的概率.在合理的假设条件下, 我们建立了相应的最优方程序列,验证了最优风险函数序列是最优方程序列的唯一解,并证明了最优马氏策略的存在性.
  • 学术论文
    陈梦瑶, 戴微, 金百锁
    应用概率统计. 2023, 39(4): 491. https://doi.org/10.3969/j.issn.1001-4268.2023.04.002
    对于高维空间回归问题,本文提出了一种有效的稀疏贝叶斯模型. 通过引入分层高斯马尔可夫随机场先验,模型可以获取稀疏的空间变化参数, 同时对于相邻的空间区域也可以获取同质的参数.相较于传统的采样方法, 本文采用一种快速收敛的变分EM算法进行后验推断.对于M步, 最优化问题可以通过简单的变形转化为经典的自适应lasso问题进行快速求解. 通过数值模拟可以发现模型在参数估计和变量选择问题上取得较好的效果.最后模型用来分析欧洲社会人口学因素对各国新冠死亡率的影响.
  • 学术论文
    董迎辉, 魏思媛, 殷子涵
    应用概率统计. 2023, 39(2): 259-282. https://doi.org/10.3969/j.issn.1001-4268.2023.02.006
    基于保险人和被保险人双重视角出发, 研究了在不允许卖空和两个VaR约束下,发行分红型寿险合同的保险人的最优投资问题.
    该研究对既需在偿二代监管下最大化保险人终端财富的期望效用,又需提供给投保人最低到期保障和分红的保险人具有很好的指导意义.利用对偶控制方法和凹化技巧解决了该优化问题, 给出了最优终端财富的封闭解.数值结果显示了从保险人和被保险人双方角度出发所考虑的两个VaR约束比从保险人或被保险人任一方角度出发所考虑的单个VaR约束更能够严格改进经济状态不好时的风险管理, 达到降低道德风险的作用.
  • 学术论文
    孙鸿雁, 王华明
    应用概率统计. 2023, 39(5): 633-642. https://doi.org/10.3969/j.issn.1001-4268.2023.05.001
    本文研究半直线上带渐近零漂移的紧邻随机游动.用M表示从1到0的一个游程内粒子的最大位置. 本文研究M的分布,并刻划它的渐近分布, 该结果与简单随机游动不同.
  • 学术论文
    杨晓蓉, 李路, 武皓月, 许文婷
    应用概率统计. 2023, 39(4): 604-622. https://doi.org/10.3969/j.issn.1001-4268.2023.04.010
    本文针对一种具有广泛适用性的半参数模型,部分线性可加模型, 研究其响应变量存在删失数据时模型系数和非参数函数的估计.对此, 提出了一种基于数据增广的复合分位数回归估计方法.该方法利用分位数回归和分布函数之间的联系, 构造插补数据集,并通过迭代采用复合分位数回归得到最终的估计值. 所提方法放宽了对模型的假设,不但对迭代初始值的要求很低, 还允许响应变量同时存在多种类型的删失,具有一定的普适性. 数值模拟表明所提方法可以较为准确地估计出删失部分线性可加模型的系数和非参数函数. 实证研究中, 本文选取了北京市空气质量数据,测度了PM10浓度、CO浓度、温度、气压以及露点对PM2.5浓度的影响.结果显示, 部分线性可加模型的复合分位数回归可以较好地从线性和非线性关系两个角度来刻画这些因素对PM2.5浓度的影响,并且所提方法在删失数据的处理上表现良好.
  • 学术论文
    陈金淑, 唐玉玲
    应用概率统计. 2023, 39(3): 436-448. https://doi.org/10.3969/j.issn.1001-4268.2023.03.008
    设M是一个具有混沌表示性质的离散时间正规鞅,$\mathscr{S}(M)\subset L^2(M)\subset\mathscr{S}^*(M)$是基于M泛函的Gel'fand三元组. 从$\mathscr{S}(M)$到$\mathscr{S}^*(M)$的连续线性算子可称为M泛函上的广义算子, 以$\mathscr{L}$表示此类算子的全体.本文的主要目的在于建立$\mathscr{L}$值函数关于$\mathscr{L}$值测度的积分运算. 为此, 本文首先讨论$\mathscr{L}$值测度的基本性质,在此基础上定义了$\mathscr{L}$值函数关于$\mathscr{L}$值测度在卷积意义下的Bochner积分, 并建立了相应的控制收敛定理和卷积意义下的Fubini定理.

  • 学术论文
    郭云瑞, 梁晓青
    应用概率统计. 2023, 39(4): 531-546. https://doi.org/10.3969/j.issn.1001-4268.2023.04.005
    本文研究在随机工资和模型不确定性影响下确定缴费型养老金的鲁棒最优投资问题. 在模型中,养老金账户中的资本可以投资于一种风险资产和一种无风险资产,假设风险资产价格满足Heston模型. 研究目标是通过选择最优投资策略,使得养老金账户的终端相对财富效用最大化. 利用随机动态规划的方法,我们求出了在幂效用函数和指数效用函数下鲁棒最优投资策略和相应的值函数.最后, 通过MATLAB软件对理论结果进行了数值分析.
  • 学术论文
    张博, 刘朝林, 于文广, 李婧
    应用概率统计. 2023, 39(5): 643-658. https://doi.org/10.3969/j.issn.1001-4268.2023.05.002
    本文考虑对具有扩散扰动影响的复合泊松风险模型下的破产概率进行非参数估计.我们基于复傅里叶级数展开方法(CFS)对破产概率进行逼近,并利用索赔次数和索赔额的随机样本值对破产概率进行非参数估计.同时我们还对估计量在大样本下进行了误差分析, 提供了模拟结果,验证了在样本量有限下这种估计方法的有效性.
  • 学术论文
    林红梅, 张少东, 彭宜洛, 杜金艳
    应用概率统计. 2023, 39(4): 561-576. https://doi.org/10.3969/j.issn.1001-4268.2023.04.007
    纵向数据是一类在社会学、经济学、生物医学、传染病学等领域有着广泛应用的重要的数据类型. 然而在实际问题中,人们会经常遇到变量维数很高且关心的变量不能直接观测也即存在测量误差的情形.为了解决此类问题, 本文研究存在测量误差的纵向数据下单指标模型的估计问题.基于局部线性光滑法和模拟外推(SIMEX)法,本文构造了估计单指标参数和非参连接函数的新方法.通过蒙特卡罗数值模拟验证所提估计方法的有效性,与忽略测量误差的Naive估计以及忽略个体内部相关性的估计相比,本文所构造的估计具有更小的均方误差. 最后,我们将本文方法应用到上市公司投资需求的实际数据分析中,结果表明在实际问题中测量误差对参数估计影响显著.
  • 学术论文
    李金凤, 蒋亦凡, 杜恺
    应用概率统计. 2023, 39(4): 517-530. https://doi.org/10.3969/j.issn.1001-4268.2023.04.004
    本文研究了一类耦合平均场正倒向随机微分方程的数值解法, 在其解耦场存在并满足一定正则性的条件下,给出了正倒向随机微分方程的后验估计.该后验估计表明正倒向方程解的误差可以由终端项的误差所控制, 进一步,我们基于深度神经网络提出了数值算法并对离散格式进行了收敛性分析.
  • 学术论文
    杨梦兰, 杨淑振
    应用概率统计. 2023, 39(4): 623-632. https://doi.org/10.3969/j.issn.1001-4268.2023.04.011
    在金融市场中, VaR和ES被广泛应用于资产风险度量、投资组合管理和保证金计算等方面, 是银行资本和风险监管的国际统一标准.由于VaR具有一定的局限性, 近年来,ES作为一种重要的风险度量方法深受金融机构关注. 本文基于次线性期望理论,在G-VaR的基础上, 提出了一种新的G-ES的计算方法,这种计算方法可以很自然地结合G-VaR进行回测.对于标普500指数以及沪深~300~指数数据, 与其他常用的模型, 如历史模拟,AR-GARCH模型, 基于极值理论的POT模型等进行比较,实证分析的结果表明这一新型的G-ES在不同历史数据窗口下都有着很好的表现.
  • 学术论文
    宋子豪, 韩苗
    应用概率统计. 2023, 39(4): 547-560. https://doi.org/10.3969/j.issn.1001-4268.2023.04.006
    本文研究了机制转换跳扩散模型下外汇挂钩的相关期权的定价问题. 在风险中性概率测度下,假设汇率服从机制转换均值回复模型、资产价格服从机制转换跳扩散模型,通过测度变换和傅里叶变换方法, 推导出了外汇挂钩相关期权的定价公式.运用快速傅里叶变换算法求得期权价值的数值解,并比较分析了不同模型以及一些重要参数对外汇挂钩相关期权价值的影响情况.
  • 学术论文
    穆婉莹, 王心怡, 冯峥晖
    应用概率统计. 2023, 39(5): 667-681. https://doi.org/10.3969/j.issn.1001-4268.2023.05.004
    光谱分析技术是分析化学中常用的方法之一,也广泛应用于中药分析等领域. 本文用函数型数据分析的方法分析光谱数据,研究针对光谱数据的异常检测方法, 挑选出异常(离群)的样本.基于现有方法, 我们提出``欧加深度检测方法''. 数值模拟结果显示,欧加深度检测方法能较好地挑选出异常情况的样本.本文将欧加深度检测方法和三种已有方法应用于分析73剂中药六混液光谱数据,结果显示, 欧加深度方法能够检测出全部6剂不合格样本, 有较好的应用前景.
  • 学术论文
    温鲜, 霍海峰
    应用概率统计. 2023, 39(4): 577-588. https://doi.org/10.3969/j.issn.1001-4268.2023.04.008
    本文考虑半马氏决策过程的指数效用最优问题, 其中状态和行动空间均为Borel集, 报酬函数非负.最优准则是最大化系统无限阶段内获取总报酬指数效用的期望值. 首先,建立标准正则性条件确保状态过程非爆炸,连续--紧条件确保最优策略存在. 其次, 基于这些条件,利用值迭代和嵌入链技术,证明了值函数是相应最优方程的唯一解以及最优策略的存在性. 最后,通过实例展示了如何利用值迭代算法计算值函数和最优策略.
  • 学术论文
    石雪妮, 达高峰
    应用概率统计. 2023, 39(5): 747-764. https://doi.org/10.3969/j.issn.1001-4268.2023.05.009
    概率组合方法是分析无线传感器网络(wireless sensor network, WSN)可靠性的重要方法,它能够有效处理该网络中的隔离效应和竞争失效问题. 然而,已有文献中基于概率组合方法的WSN可靠性建模和计算存在一些缺陷,导致研究结果应用范围受限甚至错误地评估WSN的可靠性.本文研究了一类典型的WSN-----具有随机依赖机制的单中继器WSN的可靠性建模与计算. 在组件局部失效和外部攻击导致全局失效的竞争失效机制下,建立了WSN更符合实际亦更严谨的可靠性模型, 基于严格的概率组合分析,呈现了系统化的可靠性计算方法和计算公式, 改进了文献中关于此类问题的研究.最后, 作为算法应用展示,我们计算了两个特殊的WSN-----身体传感网络和空气监测系统的可靠性.
  • 学术论文
    郑群珍, 封平华, 张宏波
    应用概率统计. 2023, 39(4): 506. https://doi.org/10.3969/j.issn.1001-4268.2023.04.003
    本文讨论离散时间Geo/T-IPH/1排队,其中T-IPH表示可数状态吸收生灭链吸收时间的分布.首先对排队系统建立无限位相拟生灭过程(QBD)模型,然后通过算子几何解方法, 得到了过程联合平稳分布的解. 在此基础上,进一步得到了所研究排队系统平稳队长分布的精确解. 最后,还通过数值例子说明了分析方法的有效性.
  • 学术论文
    全卓君, 郑明, 郁文
    应用概率统计. 2023, 39(5): 730-746. https://doi.org/10.3969/j.issn.1001-4268.2023.05.008
    本文基于半监督推断方法,研究了标记数据来自病例对照抽样而逻辑回归模型不正确时相关目标参数的估计问题.在二分类任务中, 常用病例对照抽样解决数据结构不平衡的问题,常用逻辑回归模型作为统计模型. 但在现实应用中,模型假设往往是错误的. 若逻辑回归模型错误,仅利用病例对照抽样获得的标记数据无法对病例比例进行识别进而无法对目标参数,即使得总体风险达到最小值的参数进行估计. 本文借助于半监督推断方法,首先利用标记数据和无标记数据得到病例比例的无偏估计, 然后基于该估计,构造逆概率加权的损失函数来纠正病例对照数据中的抽样偏差.本文证明了求解以上的损失函数得到的解是关于目标参数的相合且渐近正态的估计,并且其极限分布的方差也可以通过观察到的数据进行一致地估计. 同时,模拟研究的结果表明论文提出的方法能对目标参数给出相合的估计.
  • 学术论文
    邱德华, 赵倩君
    应用概率统计. 2023, 39(5): 659-666. https://doi.org/10.3969/j.issn.1001-4268.2023.05.003
    设{X,X_n,n\geq1\}是同分布的NA随机变量序列,h(\cdot)>0是定义在(0,\infty)上的不减函数且满足\int_1^\infty[th(t)]^{-1}\md t=\infty. 令\psi(t)=\int_1^t[sh(s)]^{-1}\md s,t\geq 1, S_n=\sum_{i=1}^nX_i, n\geq 1, Lt=\ln\max\{e,t\}.本文证明了\sum_{n=1}^\infty[nh(n)]^{-1}\pr(\max_{1\leq j\leq n}|S_j|\geq(1+\varepsilon)\sigma\sqrt{2nL\psi(n)})<\infty, \forall\,\varepsilon>0成立的充要条件是\ep(X)=0和\ep(X^2)=\sigma^2\in(0,\infty). 这一结果部分地推广了文献\ncite{7}的结论.