科研成果

基于LAZE先验的机器学习方法在癌症数据上的应用

发布时间: 2017-11-02 21:41:33

   本研究主要研究如何通过机器学习方法建立基于前列腺癌数据的具有稀疏性的贝叶斯模型。在传统稀疏算法的基础上,本研究首次在癌症检测问题上引入了基于LAZE(Laplace with an atom at Zero,简写为LAZE)先验的机器学习方法,该先验分布是由Laplace分布与Dirac分布组合而成的混合分布,即在零处有一个脉冲的Laplace先验。本研究通过MCMC算法求解基于LAZE先验的贝叶斯模型,该模型比基于Laplace先验的贝叶斯模型更适合于检测前列腺癌。通过在特定前列腺癌数据上的实验,该模型优于传统稀疏算法。

   具体地,本研究首先对癌症数据进行分析,描述了癌症数据维度往往很高且包含较多不相关维度这一特点;针对这一特点,本研究对常用的稀疏算法进行描述,对比了传统稀疏算法和贝叶斯学派的模型与算法;进一步地,为了提高贝叶斯模型得到的结果的稀疏性,本研究首次在癌症数据上引入了基于LAZE先验的贝叶斯模型,并描述了一个MCMC算法用于求解该模型,最后在实验上证明了该模型具有比传统稀疏算法和常规贝叶斯模型更好的结果。

   在未来的研究中,我们将着重于推广该模型,使其能够并行化,可以运用于更高维度更大范围的医疗大数据;推广其先验分布,应用于非线性更强的数据等。

参考文献:

1、林颖,叶颀. 基于LAZE先验的机器学习方法在癌症数据上的应用——以前列腺癌数据集为例. 华南师范大学学报. Volume 50, Issue 4, Pages 115-120, 2018, DOI: 10.6054/j.jscnun.2018089.