用于 KDD 杯 2009 小挑战的 AUC 分裂准则的逻辑模型树

Patrick Doetsch, Christian Buck, Pavlo Golik, Niklas Hoppe, Michael Kramp, Johannes Laudenberg, Christian Oberdörfer, Pascal Steingrube, Jens Forster, Arne Mauser
KDD 杯 2009 竞赛论文集, PMLR 7:77-88, 2009.

摘要

在这项工作中,我们描述了我们对 KDD 杯 2009 “小挑战” 的方法,这是一个具有不完整数据的分类任务。 预处理、特征提取和模型选择都进行了详细记录。 我们建议使用基于缺失值数量的标准来选择适合每种特征的插补方法。 逻辑模型树 (LMT) 扩展了以优化 ROC 曲线下的面积 (AUC) 为分裂准则,而 AUC 是要求的评估标准。 通过堆叠提升决策树桩和 LMT,我们在不使用来自其他特征集中的额外数据的情况下,获得了“小挑战”的最佳结果,AUC 分数为 0.8081。 我们还展示了 AUC 优化模型组合的结果,其得分略差,AUC 分数为 0.8074。

引用本文


BibTeX
@InProceedings{pmlr-v7-doetsch09, title = {用于 KDD 杯 2009 小挑战的 AUC 分裂准则的逻辑模型树}, author = {Doetsch, Patrick and Buck, Christian and Golik, Pavlo and Hoppe, Niklas and Kramp, Michael and Laudenberg, Johannes and Oberdörfer, Christian and Steingrube, Pascal and Forster, Jens and Mauser, Arne}, booktitle = {KDD 杯 2009 竞赛论文集}, pages = {77--88}, year = {2009}, editor = {Dror, Gideon and Boullé, Mar and Guyon, Isabelle and Lemaire, Vincent and Vogel, David}, volume = {7}, series = {机器学习研究论文集}, address = {New York, New York, USA}, month = {28 Jun}, publisher = {PMLR}, pdf = {https://pmlr.com.cn/v7/doetsch09/doetsch09.pdf}, url = {https://pmlr.com.cn/v7/doetsch09.html}, abstract = {在这项工作中,我们描述了我们对 KDD 杯 2009 “小挑战” 的方法,这是一个具有不完整数据的分类任务。 预处理、特征提取和模型选择都进行了详细记录。 我们建议使用基于缺失值数量的标准来选择适合每种特征的插补方法。 逻辑模型树 (LMT) 扩展了以优化 ROC 曲线下的面积 (AUC) 为分裂准则,而 AUC 是要求的评估标准。 通过堆叠提升决策树桩和 LMT,我们在不使用来自其他特征集中的额外数据的情况下,获得了“小挑战”的最佳结果,AUC 分数为 0.8081。 我们还展示了 AUC 优化模型组合的结果,其得分略差,AUC 分数为 0.8074.} }
Endnote
%0 会议论文 %T 用于 KDD 杯 2009 小挑战的 AUC 分裂准则的逻辑模型树 %A Patrick Doetsch %A Christian Buck %A Pavlo Golik %A Niklas Hoppe %A Michael Kramp %A Johannes Laudenberg %A Christian Oberdörfer %A Pascal Steingrube %A Jens Forster %A Arne Mauser %B KDD 杯 2009 竞赛论文集 %C 机器学习研究论文集 %D 2009 %E Gideon Dror %E Mar Boullé %E Isabelle Guyon %E Vincent Lemaire %E David Vogel %F pmlr-v7-doetsch09 %I PMLR %P 77--88 %U https://pmlr.com.cn/v7/doetsch09.html %V 7 %X 这项工作中,我们描述了我们对 KDD 杯 2009 “小挑战” 的方法,这是一个具有不完整数据的分类任务。 预处理、特征提取和模型选择都进行了详细记录。 我们建议使用基于缺失值数量的标准来选择适合每种特征的插补方法。 逻辑模型树 (LMT) 扩展了以优化 ROC 曲线下的面积 (AUC) 为分裂准则,而 AUC 是要求的评估标准。 通过堆叠提升决策树桩和 LMT,我们在不使用来自其他特征集中的额外数据的情况下,获得了“小挑战”的最佳结果,AUC 分数为 0.8081。 我们还展示了 AUC 优化模型组合的结果,其得分略差,AUC 分数为 0.8074。
RIS
TY - CPAPER TI - 用于 KDD 杯 2009 小挑战的 AUC 分裂准则的逻辑模型树 AU - Patrick Doetsch AU - Christian Buck AU - Pavlo Golik AU - Niklas Hoppe AU - Michael Kramp AU - Johannes Laudenberg AU - Christian Oberdörfer AU - Pascal Steingrube AU - Jens Forster AU - Arne Mauser BT - KDD 杯 2009 竞赛论文集 DA - 2009/12/04 ED - Gideon Dror ED - Mar Boullé ED - Isabelle Guyon ED - Vincent Lemaire ED - David Vogel ID - pmlr-v7-doetsch09 PB - PMLR DP - 机器学习研究论文集 VL - 7 SP - 77 EP - 88 L1 - https://pmlr.com.cn/v7/doetsch09/doetsch09.pdf UR - https://pmlr.com.cn/v7/doetsch09.html AB - 这项工作中,我们描述了我们对 KDD 杯 2009 “小挑战” 的方法,这是一个具有不完整数据的分类任务。 预处理、特征提取和模型选择都进行了详细记录。 我们建议使用基于缺失值数量的标准来选择适合每种特征的插补方法。 逻辑模型树 (LMT) 扩展了以优化 ROC 曲线下的面积 (AUC) 为分裂准则,而 AUC 是要求的评估标准。 通过堆叠提升决策树桩和 LMT,我们在不使用来自其他特征集中的额外数据的情况下,获得了“小挑战”的最佳结果,AUC 分数为 0.8081。 我们还展示了 AUC 优化模型组合的结果,其得分略差,AUC 分数为 0.8074. ER -
APA
Doetsch, P., Buck, C., Golik, P., Hoppe, N., Kramp, M., Laudenberg, J., Oberdörfer, C., Steingrube, P., Forster, J. & Mauser, A. (2009). 用于 KDD 杯 2009 小挑战的 AUC 分裂准则的逻辑模型树. KDD 杯 2009 竞赛论文集, in 机器学习研究论文集 7:77-88 可从 https://pmlr.com.cn/v7/doetsch09.html 获取.

相关材料