[编辑]
基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用
KDD-Cup 2009竞赛论文集, PMLR 7:101-109, 2009.
摘要
本文描述了最近开发的集成学习方法加性林模型在KDD Cup'09竞赛中的一个实地试验。加性林模型被应用于竞赛提供的三个任务,使用了“小型”数据集。在其中一个任务,即倾向性预测(appetency)上,我们获得了仅使用小型数据集参赛者中的最佳结果。竞赛后分析表明,在另一个任务,即客户流失(churn)上,较差的结果部分原因是名义属性的预处理不足。加性林模型的代码作为TreeExtra包的一部分公开可用。该包的另一部分提供了一种重要的预处理技术,也用于本次竞赛条目,即通过多重计数进行特征评估。