数据与计算发展前沿 ›› 2021, Vol. 3 ›› Issue (2): 60-67.
doi: 10.11871/jfdc.issn.2096-742X.2021.02.007
LIU Chunyu1,2,*(),SHI Zhuomin1(
),YU Jianjun1(
)
摘要:
【目的】针对目前科研院所财务报销不规范导致的反复审批等问题,本文研究通过预测结果提升报销审批效率。【方法】本文针对财务报销审批进行业务建模,形成可机器理解的报销审批脱敏数据,并根据实际业务特点构造变量特征与标签,采用随机森林对重构后的变量进行重要度分析。使用决策树、随机森林、梯度随机树以及XGBoost四种分类算法对报销审批结果进行预测。【结果】通过随机森林算法证实重构变量对于报销审批结果预测的可靠性。四种树模型根据重构后的训练数据集归纳出一组分类规则,采用该规则对未审批的报销单进行预测,通过预测结果从四种树模型中评定出最佳模型。【结论】文章基于树模型,通过构造随机森林辅助判断影响报销审批结果的关键因素,并选用树模型算法实现报销审批预测模型的构建,为树模型在报销审批预测中的应用提供了算法基础。