《A polynomial algorithm for best subset selection problem》在美国科学院院刊(PNAS)发表
中山大学华南统计科学研究中心博士研究生朱俊贤和朱进与温灿红,张和平及王学钦三位学者深入合作,于2020年12月6日,在美国科学院院刊(PNAS)发表题为《A polynomial algorithm for best subset selection problem》的论文。该研究主要针对线性回归模型的基准问题——最优子集选取,提出了一种快速算法。
最优子集选取是指在解释变量中找到最优的解释变量集,使得回归模型有最好的预测准确性。在全基因组研究等背景下,回归方程通常会涉及到百万个解释变量,这使得从中筛选最优的子集成为一个非常棘手的问题。
文章利用排序和剪接的思想,并引入一个新的信息准则,提出了一个在适当的正则条件下,能够在有限步中得到一个稳定的解的算法;并且文章进一步证明了该解是回归系数一个真实有效的估计。更重要的是,文章证明了在一定条件下算法的时间复杂度依概率1是多项式的。
作者简介
朱俊贤
中山大学数学学院统计学专业博士生。主要研究领域为高维变量选择、全基因组关联分析、混合模型等。研究论文发表于Proceedings of the National Academy of Sciences of the United States of America, Genetic Epidemiology, Biometrics等。
朱进
中山大学数学学院统计学专业博士生。主要研究领域为统计推断,高维数据分析等。研究论文发表于Proceedings of the National Academy of Sciences of the United States of America, Journal of the American Statistical Association, Journal of Statistical Software等。发布Ball等多个统计软件,累计下载量逾5万次。
