基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用

Daria Sorokina
KDD-Cup 2009竞赛论文集, PMLR 7:101-109, 2009.

摘要

本文描述了最近开发的集成学习方法加性林模型在KDD Cup'09竞赛中的一个实地试验。加性林模型被应用于竞赛提供的三个任务,使用了“小型”数据集。在其中一个任务,即倾向性预测(appetency)上,我们获得了仅使用小型数据集参赛者中的最佳结果。竞赛后分析表明,在另一个任务,即客户流失(churn)上,较差的结果部分原因是名义属性的预处理不足。加性林模型的代码作为TreeExtra包的一部分公开可用。该包的另一部分提供了一种重要的预处理技术,也用于本次竞赛条目,即通过多重计数进行特征评估。

引用本文


BibTeX
@InProceedings{pmlr-v7-sorokina09, title = {基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用}, author = {Sorokina, Daria}, booktitle = {KDD-Cup 2009竞赛论文集}, pages = {101--109}, year = {2009}, editor = {Dror, Gideon and Boullé, Mar and Guyon, Isabelle and Lemaire, Vincent and Vogel, David}, volume = {7}, series = {机器学习研究论文集}, address = {New York, New York, USA}, month = {28 Jun}, publisher = {PMLR}, pdf = {https://pmlr.com.cn/v7/sorokina09/sorokina09.pdf}, url = {https://pmlr.com.cn/v7/sorokina09.html}, abstract = {本文描述了最近开发的集成学习方法加性林模型在KDD Cup'09竞赛中的一个实地试验。加性林模型被应用于竞赛提供的三个任务,使用了“小型”数据集。在其中一个任务,即倾向性预测(appetency)上,我们获得了仅使用小型数据集参赛者中的最佳结果。竞赛后分析表明,在另一个任务,即客户流失(churn)上,较差的结果部分原因是名义属性的预处理不足。加性林模型的代码作为TreeExtra包的一部分公开可用。该包的另一部分提供了一种重要的预处理技术,也用于本次竞赛条目,即通过多重计数进行特征评估。} }
Endnote
%0 会议论文 %T 基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用 %A Daria Sorokina %B KDD-Cup 2009竞赛论文集 %C 机器学习研究论文集 %D 2009 %E Gideon Dror %E Mar Boullé %E Isabelle Guyon %E Vincent Lemaire %E David Vogel %F pmlr-v7-sorokina09 %I PMLR %P 101--109 %U https://pmlr.com.cn/v7/sorokina09.html %V 7 %X 本文描述了最近开发的集成学习方法加性林模型在KDD Cup'09竞赛中的一个实地试验。加性林模型被应用于竞赛提供的三个任务,使用了“小型”数据集。在其中一个任务,即倾向性预测(appetency)上,我们获得了仅使用小型数据集参赛者中的最佳结果。竞赛后分析表明,在另一个任务,即客户流失(churn)上,较差的结果部分原因是名义属性的预处理不足。加性林模型的代码作为TreeExtra包的一部分公开可用。该包的另一部分提供了一种重要的预处理技术,也用于本次竞赛条目,即通过多重计数进行特征评估。
RIS
TY - CPAPER TI - 基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用 AU - Daria Sorokina BT - KDD-Cup 2009竞赛论文集 DA - 2009/12/04 ED - Gideon Dror ED - Mar Boullé ED - Isabelle Guyon ED - Vincent Lemaire ED - David Vogel ID - pmlr-v7-sorokina09 PB - PMLR DP - 机器学习研究论文集 VL - 7 SP - 101 EP - 109 L1 - https://pmlr.com.cn/v7/sorokina09/sorokina09.pdf UR - https://pmlr.com.cn/v7/sorokina09.html AB - 本文描述了最近开发的集成学习方法加性林模型在KDD Cup'09竞赛中的一个实地试验。加性林模型被应用于竞赛提供的三个任务,使用了“小型”数据集。在其中一个任务,即倾向性预测(appetency)上,我们获得了仅使用小型数据集参赛者中的最佳结果。竞赛后分析表明,在另一个任务,即客户流失(churn)上,较差的结果部分原因是名义属性的预处理不足。加性林模型的代码作为TreeExtra包的一部分公开可用。该包的另一部分提供了一种重要的预处理技术,也用于本次竞赛条目,即通过多重计数进行特征评估。 ER -
APA
Sorokina, D.. (2009). 基于多重计数特征评估的加性林模型在KDD Cup'09小型数据集上的应用. KDD-Cup 2009竞赛论文集, in 机器学习研究论文集 7:101-109 可从 https://pmlr.com.cn/v7/sorokina09.html 获取.

相关材料