使用 Actor 框架部署高吞吐量预测模型

Brian Gawalt
第二届预测 API 和应用国际会议论文集, PMLR 50:15-28, 2016。

摘要

大多数数据科学和机器学习教程侧重于生成模型:组装数据集;将数据拆分为训练、验证和测试子集;构建模型;并演示其泛化能力。但当需要在生产中使用模型时,重复这些步骤时,可能会出现高延迟或低吞吐量的问题。对于最终用户来说,花费过多时间对原始数据进行特征化以及对特征进行模型评估的成本,最终可能会抵消更智能的预测所带来的任何收益。暴露这些模型使用步骤中的并发性,然后利用这种并发性,可以提高吞吐量。本文描述了如何使用 Actor 框架将预测模型引入实时环境。描述了两个案例研究示例:为自由职业平台 Upwork 构建的实时部署,以及一个简单的文本分类器,并附带代码,可作为入门项目使用。

引用本文


BibTeX
@InProceedings{pmlr-v50-gawalt15, title = {使用 Actor 框架部署高吞吐量预测模型}, author = {Gawalt, Brian}, booktitle = {第二届预测 API 和应用国际会议论文集}, pages = {15--28}, year = {2016}, editor = {Dorard, Louis and Reid, Mark D. and Martin, Francisco J.}, volume = {50}, series = {机器学习研究论文集}, address = {澳大利亚悉尼}, month = {06--07 Aug}, publisher = {PMLR}, pdf = {https://pmlr.com.cn/v50/gawalt15.pdf}, url = {https://pmlr.com.cn/v50/gawalt15.html}, abstract = {大多数数据科学和机器学习教程侧重于生成模型:组装数据集;将数据拆分为训练、验证和测试子集;构建模型;并演示其泛化能力。但当需要在生产中使用模型时,重复这些步骤时,可能会出现高延迟或低吞吐量的问题。对于最终用户来说,花费过多时间对原始数据进行特征化以及对特征进行模型评估的成本,最终可能会抵消更智能的预测所带来的任何收益。暴露这些模型使用步骤中的并发性,然后利用这种并发性,可以提高吞吐量。本文描述了如何使用 Actor 框架将预测模型引入实时环境。描述了两个案例研究示例:为自由职业平台 Upwork 构建的实时部署,以及一个简单的文本分类器,并附带代码,可作为入门项目使用。} }
Endnote
%0 会议论文 %T 使用 Actor 框架部署高吞吐量预测模型 %A Brian Gawalt %B 第二届预测 API 和应用国际会议论文集 %C 机器学习研究论文集 %D 2016 %E Louis Dorard %E Mark D. Reid %E Francisco J. Martin %F pmlr-v50-gawalt15 %I PMLR %P 15--28 %U https://pmlr.com.cn/v50/gawalt15.html %V 50 %X 大多数数据科学和机器学习教程侧重于生成模型:组装数据集;将数据拆分为训练、验证和测试子集;构建模型;并演示其泛化能力。但当需要在生产中使用模型时,重复这些步骤时,可能会出现高延迟或低吞吐量的问题。对于最终用户来说,花费过多时间对原始数据进行特征化以及对特征进行模型评估的成本,最终可能会抵消更智能的预测所带来的任何收益。暴露这些模型使用步骤中的并发性,然后利用这种并发性,可以提高吞吐量。本文描述了如何使用 Actor 框架将预测模型引入实时环境。描述了两个案例研究示例:为自由职业平台 Upwork 构建的实时部署,以及一个简单的文本分类器,并附带代码,可作为入门项目使用。
RIS
TY - CPAPER TI - 使用 Actor 框架部署高吞吐量预测模型 AU - Brian Gawalt BT - 第二届预测 API 和应用国际会议论文集 DA - 2016/06/05 ED - Louis Dorard ED - Mark D. Reid ED - Francisco J. Martin ID - pmlr-v50-gawalt15 PB - PMLR DP - 机器学习研究论文集 VL - 50 SP - 15 EP - 28 L1 - https://pmlr.com.cn/v50/gawalt15.pdf UR - https://pmlr.com.cn/v50/gawalt15.html AB - 大多数数据科学和机器学习教程侧重于生成模型:组装数据集;将数据拆分为训练、验证和测试子集;构建模型;并演示其泛化能力。但当需要在生产中使用模型时,重复这些步骤时,可能会出现高延迟或低吞吐量的问题。对于最终用户来说,花费过多时间对原始数据进行特征化以及对特征进行模型评估的成本,最终可能会抵消更智能的预测所带来的任何收益。暴露这些模型使用步骤中的并发性,然后利用这种并发性,可以提高吞吐量。本文描述了如何使用 Actor 框架将预测模型引入实时环境。描述了两个案例研究示例:为自由职业平台 Upwork 构建的实时部署,以及一个简单的文本分类器,并附带代码,可作为入门项目使用。 ER -
APA
Gawalt, B.. (2016). 使用 Actor 框架部署高吞吐量预测模型. 第二届预测 API 和应用国际会议论文集, in 机器学习研究论文集 50:15-28 可从 https://pmlr.com.cn/v50/gawalt15.html 获取。

相关材料