[编辑]
探索与利用挑战赛 2011 摘要
在线探索与利用交易研讨会论文集 2,PMLR 26:86-97,2012。
摘要
Pascal 探索与利用挑战赛 2011 旨在评估用于在线网站内容选择问题的算法。本文介绍了我们用于在该挑战赛中获得第二名的解决方案,以及我们进行的一些辅助实验。我们评估的方法都结构化为三层。第一层为连续和名义数据的流数据提供在线摘要。连续数据使用在线分位数摘要处理。名义数据使用基于哈希的计数结构进行总结。通过这些技术,我们构建了一个准确的流数据摘要,并具有较小的内存占用。第二层使用摘要来构建预测器。我们利用了各种类型的树,从简单的决策树桩到深度多元树。对于最后一层,我们探索了几种组合策略:在线 bagging、指数加权、线性排序器和简单的平均。