自动化系统在预测业务财务预测中击败华尔街分析师

预测业务财务

由麻省理工学院研究人员开发的自动化机器学习模型显着优于人类华尔街分析师预测季度商业销售。

使用有限的数据,这种自动化的机器学习系统预测了公司的季度销售额。

了解一家公司的真实销售额有助于确定其价值。例如,投资者经常聘请金融分析师,利用各种公开数据、计算工具和自己的直觉来预测一家公司即将到来的收益。现在麻省理工学院研究人员开发了一种自动模型,在使用非常有限的“嘈杂”数据中预测业务销售方面显着优惠。

在金融中,使用不精确但经常产生的消费者数据 - 称为“替代数据”,越来越感兴趣 - 帮助预测公司的交易和投资目的的收益。替代数据可以包括信用卡购买,来自智能手机的位置数据,甚至甚至卫星图像,均显示有多少辆车停放在零售商的地段。将替代数据与更传统但不常见的地面金融数据相结合 - 例如季度收益,新闻稿和股票价格 - 甚至每天或每周甚至可以在日常或每周内涂上公司的金融健康的更清晰的照片。

但是,到目前为止,使用替代数据非常难以准确,频繁的估计。在本月发布的论文中ACM Sigmetrics会议的诉讼程序,研究人员描述了一种预测财务的模型,这些型号仅使用匿名的每周信用卡交易和三个月的收入报告。

该模型预测预测30多家公司的季度收益,优势优势优势,专家华尔街分析师的综合估计数为57%的预测。值得注意的是,分析师可以访问任何可用的私人或公共数据和其他机器学习模型,而研究人员的模型使用了两个数据类型的非常小的数据集。

“替代数据是这些奇怪的,代理信号,以帮助跟踪公司的基础金融资金,”信息和决策系统(LIDS)的实验室中的邮编。“我们问道,'你能把这些嘈杂的信号与季度数量相结合,以估计高频公司的真正财务状况吗?”答案是肯定的。“

这种模式可以让投资者、交易员或那些希望经常将自己的销售业绩与竞争对手进行比较的公司获得优势。除了金融,该模型还可以帮助社会和政治科学家研究公共行为的聚合匿名数据。Fleder说:“这对任何想知道人们在做什么的人来说都很有用。”

加入逃离在纸上是EECS Devavrat沙教授,谁是麻省理工学院的统计资料和数据科学中心主任,成员信息与决策系统实验室的首席研究员麻省理工学院的基础数据科学研究所,副教授,塔塔基础研究学院。

解决“小数据”问题

无论好坏,很多消费者数据都会出售。例如,零售商可以购买信用卡交易或位置数据,以了解竞争对手的人们在购物。广告商可以使用数据来了解他们的广告如何影响销售。但是获得这些答案仍然依赖于人类。没有机器学习模式已经能够充分紧缩数字。

与直觉相反,问题实际上在于缺乏数据。每个财务投入,如季度报告或每周信用卡总额,只是一个数字。两年的季度报告总共只有8个数据点。例如,在同一时期,每周的信用卡数据仅仅是另外大约100个“嘈杂”数据点,这意味着它们可能包含无法解释的信息。

“我们有一个”小数据“问题,”Fleder说。“你只会得到一片人们的消费,你必须推断并推断出从这种数据的一部分真正发生的事情。”

对于他们的工作,研究人员获得了消费者信用卡交易 - 通常每周和一周间隔 - 从对冲基金到2015年到2018年的34个零售商的季度报告。在所有公司,他们共收集了306季度的数据。

计算日销售的概念相当简单。该模型假设公司的日常销售仍然相似,仅略微减少或从一天增加到下一个。在数学上,这意味着连续几天的销售价值乘以一些常量值加上一些统计噪声值 - 这捕获了公司销售中的一些固有的随机性。例如,明天的销售额较为平等的销售额乘以,比如,0.998或1.01加上噪声估计数。

如果给定日常常数和噪声水平的准确模型参数,则标准推理算法可以计算该等式以输出准确的日常销售预测。但诀窍是计算这些参数。

解开数字

这就是季度报告和概率技术方便的地方。在一个简单的世界中,可以将季度报告分开,比如提供90天来计算日常销售(暗示销售大致不变日常)。实际上,销售额在日常日期间不同。此外,包括替代数据,以帮助了解销售额在季度的变化变化的变化问题:除了嘈杂之外,购买的信用卡数据始终由总销售额的一些不确定的一小部分组成。这一切使得信用卡究竟是如何进入整体销售估算的究竟是多么困难。

Fleder说:“这需要一点解开这些数字。”“如果我们通过信用卡交易观察一家公司每周销售额的1%,我们怎么知道这是1% ?”而且,如果信用卡数据是有噪音的,你怎么知道它有多嘈杂?我们无法获得每日或每周销售总额的地面真相。但季度总数可以帮助我们解释这些总数。”

为了做到这一点,研究人员使用了标准推理算法的一种变体,称为卡尔曼滤波或信念传播,它已被用于从航天飞机到智能手机GPS的各种技术。卡尔曼滤波使用一段时间内观测到的数据测量值,其中包含噪声误差,从而在指定的时间框架内生成未知变量的概率分布。在研究人员的工作中,这意味着估计一天可能的销售额。

为了训练该模型,该技术首先将季度销售分解为一个固定的天数,比如90天,从而使销售额每天都有所变化。然后,它将观察到的、有噪声的信用卡数据与未知的每日销售额进行匹配。通过使用季度数据和一些外推,该公司估算了信用卡数据可能代表的总销售额的比例。然后,它计算每天所观察到的销售额、噪音水平的比例,以及预测效果的误差估计数。

推理算法将所有这些值插入公式中以预测每日销售总额。然后,它可以将这些总计保存每周,每月或季度。全部34家公司,该模型击败了一项共识基准 - 这与华尔街分析师的估计相结合 - 占306季度预测的57.2%。

接下来,研究人员正在设计一个模型来分析信用卡交易和其他替代数据的组合,比如位置信息。“这不是我们能做的全部。这只是一个自然的起点,”Fleder说。

参考:Michael Fleder和Devavrat Shah的“与替代数据预测”,ACM Sigmetrics会议的诉讼程序,第3卷第3号,2019年12月,第46号。
DOI:10.1145 / 3366694

2评论在“自动化系统中击败华尔街分析师预测业务财务”

  1. 感谢美国的一切!

  2. 公司需要及时分析趋势,调整他们的提议来改变客户要求,尝试新方法,并迅速提出并实施与客户互动的新方法。因此,通常,传统本地服务器系统的本机开发能力和架构不会跟上更改。借助迅速改进的模块化解决方案,在生产中迅速推出并允许您毫不拖延地实施想法,因此值得自动化。

发表评论

邮箱地址可选。如果提供,您的电子邮件将不会被发布或共享。