近日,工业工程与管理系李勇祥副教授以第一作者在机器学习领域期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 发表论文“Optimal Composite Likelihood Estimation and Prediction for Large-scale Gaussian Process Models”,探讨了大规模高斯过程的一种分布式建模方法,为大规模GP建模提供了新的范式,可在多台计算机上实现高效建模。
高斯过程模型的非线性建模和不确定性定量能力,使其成为现代数据科学和机器学习领域中的核心工具之一,并在很多领域的实际应用中发挥着关键作用。经典GP建模方法由于单台计算机的算力和内存限制,无法满足数据规模日益增长的大数据时代的建模需求。论文探讨了大规模高斯过程的一种分布式建模方法,为基于分布式计算的 GP 建模提出了一种最优混合似然函数(OCL),可最大限度地减少因分布式建模引起的信息损失;基于OCL提出了最佳线性无偏分块估计(BLUBP),证明了其在分块数据建模中具有最小的预测方差。研究为大规模GP建模提供了新的范式,可在多台计算机上实现高效建模,同时获得和经典建模方法极为接近的准确性。
TPAMI作为机器学习人工智能领域最受关注的期刊之一,其影响因子在机器学习、人工智能、计算机视觉等领域的期刊中常年位居前列,最近一年的影响因子为23.6。
论文链接:https://ieeexplore.ieee.org/document/10301563