文件名称:大数据新闻供应商:机器学习的实用见解-研究论文
文件大小:1.34MB
文件格式:PDF
更新时间:2024-06-09 00:26:36
big data newsvendor machine learning
当我们对与需求相关的p个特征的n个观察结果以及历史需求数据进行n次观察时,我们研究了数据驱动的新闻供应商问题。 我们建议通过单步机器学习算法来解决“大数据”新闻供应商问题,而不是先估算需求分布然后针对最佳订单数量进行优化的两步过程。 具体而言,我们提出了基于经验风险最小化(ERM)原理的算法(有无正则化)以及基于核权重优化(KO)的算法。 等效于高维分位数回归的ERM方法可以通过凸优化问题来解决,而KO方法可以通过排序算法来解决。 我们通过分析功能的遗漏产生不一致的决策来分析使用这些功能的合理性。 然后,我们得出基于特征的算法的样本外成本的有限样本性能界限,从而量化维度和成本参数的影响。 基于算法稳定性理论,我们的界线概括了没有特征信息的新闻供应商问题的已知分析。 最后,我们使用来自英国一家大型教学医院的数据集,将基于特征的算法应用于医院急诊室的护士人员配备,发现(i)最佳的ERM和KO算法比最佳实践基准分别高出23%和24% (ii)最佳KO算法比最佳ERM算法*个数量级,而最佳实践基准则快两个数量级。