无论您最喜欢的调味品是亨氏番茄酱,还是您最喜欢的百吉饼涂抹酱是费城奶油奶酪,要确保所有客户都能在正确的地点、以正确的价格、在正确的时间获得他们喜欢的产品,就需要仔细的供应链组织和分配。随着电子商务的激增和消费品 (CPG) 行业需求的变化,人工智能和机器学习 (ML) 已成为提高效率和改善业务成果的有用工具。
卡夫亨氏公司机器学习运营和平台全球主管 Jorge Balestra 表示,成功部署机器学习运营 (MLOps) 的旅程从数据开始。管理组织良好且可访问的数据意味着企业可以利用其数据量来训练和开发人工智能和机器学习模型。强大的数据策略为这些人工智能和机器学习工具使用数据来检测供应链中断、识别和解决成本效率低下以及预测产品需求奠定了基础。
“永远不要忘记,数据是燃料,数据需要付出努力,它是一个旅程,永无止境,因为这就是我所说的区别许多成功的努力与不成功的努力的真正区别,”Balestra 说。
这在消费品行业尤其重要,但也具有挑战性,因为不同零售商之间的消费者习惯跟踪方法不一致,数据往往不完整。
他解释说:“我们并不确切知道,我们甚至不想确切地知道人们在日常生活中做了什么。我们想要的只是获得足够的数据,以便我们可以为消费者提供合适的产品”。
为了大规模部署人工智能和机器学习工具,Heinz Kraft 公司转向了云的灵活性。使用云可以实现急需的数据可访问性,同时降低计算能力。“整个事情的敏捷性呈指数级增长,因为过去需要几个月的时间,现在可以通过代码在几秒钟内完成。所以,毫无疑问,我看到围绕分析、围绕人工智能的所有爆炸式增长是如何成为可能的,因为云确实为所有这些左、右、中出现的举措提供了动力。” 巴莱斯特拉说。
Balestra 表示,虽然预测一个如此容易发生变化的行业的未来趋势可能具有挑战性,但为未来的道路做好准备意味着关注适应性和敏捷性。
“我们的使命是通过食物来取悦人们。技术、人工智能或其他技术是我们实现使命的工具。能够学习如何利用现有和未来的[技术]在正确的时间获得正确的产品价格合理,地点合适,这就是我们的宗旨。”
本期商业实验室是与Infosys Topaz 和 Infosys Cobalt 合作制作的。
Laurel Ruma: 来自《麻省理工学院技术评论》,我是 Laurel Ruma,这是商业实验室,该节目帮助企业领导者了解走出实验室并进入市场的新技术。
我们的主题是食品和饮料行业的机器学习。人工智能为客户提供创新机会,为员工提高运营效率,但制定适当的数据策略来获取这些好处至关重要。
给你两个词:全球创新。
我的嘉宾是卡夫亨氏公司机器学习运营和平台全球主管 Jorge Balestra。
本期商业实验室是与 Infosys Topaz 和 Infosys Cobalt 合作制作的。
欢迎,豪尔赫。
豪尔赫·巴莱斯特拉:非常感谢。很高兴来到这里。
劳雷尔:嗯,很高兴有你。人们可能对卡夫亨氏很熟悉,因为它是世界上最大的食品和饮料公司之一。您能和我们谈谈您在卡夫亨氏的角色以及机器学习如何帮助杂货店货架上的消费者吗?
豪尔赫:当然。我称之为,我的角色在两个领域有两个主要重点。其中之一是我领导公司全球的机器学习工程运营。另一方面,我提供了该公司在全球范围内使用的所有分析平台。因此,在我的机器学习工程和运营中,我的团队所做的第一件事就是抓住我们在全球工作的数据科学家社区正在提出的所有这些模型,我们抓住它们并加强它。我们的主要任务是我们需要做的第一件事是我们需要确保我们应用工程实践来使它们做好生产准备并且它们可以扩展,它们也可以以具有成本效益的方式运行,并从那里我们确保在我的行动中,他们在需要时就在那里。
因此,很多这些模型,因为它们成为我们日常运营的一部分,所以它们将附带我们需要做出的某些特定服务水平承诺,因此我的团队确保我们能够兑现这些承诺正确的期望。另一方面,即分析平台,我们在分析方面做了很多描述性、预测性和规范性工作。您所谈论的描述性部分只是关于我们的数据的常规仪表板、摘要部分以及数据所在的位置,公司正在使用的所有这些分析平台也是我负责的。有了这一点,你可能会认为我在公司拥有非常广泛的客户群,无论是在地理位置方面,他们都来自我们在亚洲的一些业务,一直到北美,而且还遍及整个组织,从营销到人力资源以及介于两者之间的一切。
谈到您关于机器学习如何帮助杂货店消费者的其他问题,我可能会总结一下,对于 CPG 来说,最重要的是在正确的位置以正确的价格提供正确的产品。这意味着在正确的产品上,他们的机器学习可以帮助我们的许多营销团队,例如,即使他们现在拥有最新的生成人工智能功能,也可以像集思广益和为研发创造新内容一样,我们’当我们试图找出最适合我们产品的配方时,机器学习现在肯定正在这个领域取得进展,合适的价格,以及从我们的计划到配送中心的整个过程中的成本效率,确保我们消除浪费。利用机器学习功能是我们在收入管理中全面开展的工作,这是人们购买我们产品的合适价格。
最后但并非最不重要的是正确的位置。因此,我们需要确保当我们的消费者进入他们的商店或在线购买我们的产品时,该产品适合您,并且您会立即找到您喜欢的产品和您喜欢的口味。因此,我们在预测我们的需求、组织我们的供应链、我们的分销、安排我们的计划方面付出了巨大的努力,以确保我们生产正确的数量并将它们运送到正确的地方,以便我们的消费者能够找到我们的产品。
Laurel:嗯,这当然是有道理的,因为数据确实在部署先进技术(尤其是机器学习)方面发挥着至关重要的作用。那么,卡夫亨氏如何确保所有数据在正确的时间、正确的地点的可访问性、质量和安全性,以推动有效的机器学习操作或 MLOps?您是否发现了具体的最佳实践?
Jorge:嗯,我可以建议人们的最佳实践肯定是数据是机器学习的燃料。因此,没有数据就没有建模。而数据,组织你的数据,你拥有的内部和外部的数据都需要时间。确保它不仅是可访问的,而且你可以以一种不需要处理大量技术的方式来组织它,这一点很重要,而且我想说的是它的管理。这是一项长期承诺。因此,我强烈建议现在正在倾听的人了解,您的数据旅程实际上只是一个旅程,它没有最终目的地,而且需要时间。
你在组织所需的所有数据并确保其可用方面越成功,你就越能成功地利用机器学习中的模型和实际存在的伟大事物来利用所有这些数据。然后完成特定的业务成果。因此,我想说的一个很好的比喻是,有很多研究人员,麻省理工学院以其研究而闻名,但如果没有图书馆员,没有图书馆员,没有所有组织知识的人,研究人员就无法做任何事情,这样你就可以去实际做你需要做什么,这就是这个案例研究。永远不要忘记,数据是燃料,数据需要付出努力,它是一个旅程,永无止境,因为这就是我所说的真正区别许多成功努力与不成功努力的区别。
Laurel:回到正确的时间正确的心态,在过去的几年里,消费品,或者你之前提到的消费品行业,已经看到了从不断变化的客户需求到电子商务激增的重大转变渠道。那么人工智能和机器学习工具如何帮助影响业务成果或提高运营效率呢?
Jorge:我可以举两个例子。一是,显然我们都想忘记大流行期间发生的事情,但对我们来说,这是一个关键的、非常具有挑战性的时刻,因为我们所有的供应链突然被中断,我们的消费者比以往任何时候都更需要我们的产品因为家里蹲着的人更多。因此,我告诉你的一件事,至少对我们来说,至关重要的是,通过我们的建模,通过我们拥有的数据,我们对供应链中的某些中断有了一些良好的预警,并且我们至少能够……特别是当疫情爆发时,提前几周,我们正在转移产品,我们正在采取早期行动,以确保我们交付更多所需的产品。
那是因为我们有数据,并且有一些模型提醒我们,“嘿,这里出了问题,我们的供应链发生了一些事情,你需要采取行动。” 在正确的时间采取行动,这是提前应对许多可能发生的事情的关键。就我们而言,显然我们生活在一个竞争激烈的世界,因此在竞争之前采取行动很重要,即时机因素。我可以给你举的另一个例子,更多的是我们现在正在做的越来越多的事情,我提到的关于产品可用性的正确位置对于 CPG 来说是关键,这是通过称为CFR,是客户现场率,这意味着当有人从卡夫亨氏订购产品时,我们能够 100% 履行该订单,并且我们期望在效率方面达到 90% 的高水平正在履行这些订单。
我们开发了新技术,我认为我们对此感到非常自豪,因为我认为它在 CPG 中是独一无二的,它使我们能够根据我们今天采取的具体行动真正预测 CFR 未来会发生什么,而它是改变我们的生产线,而改变分销等等,我们不仅能够看到立竿见影的效果,还能看到 CFR 未来会发生什么,这样我们就可以真正采取行动,立即采取行动有利于我们未来的分销。所以,我认为这就是我们如何在日常运营中利用人工智能和机器学习工具的两个例子。
Laurel:这些例子是 CFR 以及供应链,并确保消费者几乎可以按需获得一切,这是食品和饮料行业独有的吗?当您实施人工智能和机器学习创新时,食品和饮料行业可能还面临哪些其他独特挑战?您如何应对这样的挑战?
Jorge:是的,我认为对我们来说非常独特的是,我们总是必须处理消费者数据的不完整情况。所以,如果你想一想,当你走进一家杂货店时,有几件事,嗯,你是从那家商店购买的,克罗格、沃尔玛等等,其中一些会让你根据什么来识别你的消费模式,有的不会。而且,在我们的例子中,例如,如果您要去购买费城[奶油奶酪],您可以选择在多个商店购买费城。有时你想要更多,你就去 Costco,有时你需要更少,就我而言,我住在芝加哥地区,我去 Jewel 超市。
我们总是要处理客户的不完整数据,这是一个挑战,因为我们试图弄清楚如何根据您喜欢的产品、您在哪里购买产品、什么是正确的产品来更好地服务我们的消费者价格点,但我们总是处理不完整的数据。因此,在这种情况下,围绕我们现有的数据制定清晰的数据策略,并对我们现有的市场有清晰的了解,这样我们就可以真正抓住我们现有的不完整数据,并仍然提出正确的行动什么是正确的产品,只是给你一个例子,一个明显的例子是......我要回到费城,因为,顺便说一句,这是我最喜欢的卡夫产品......
劳雷尔:费城奶油奶酪,对吧?
豪尔赫:是的,绝对如此。接下来是我们的番茄酱。我对费城情有独钟,这是双关语。
劳雷尔: ——还有番茄酱。
豪尔赫:没错。不,但是你们有不同的演示。你有可涂抹的东西,你有奶油干酪砖,在砖里你有一些口味,我们想要做的是确保我们提供人们真正想要的口味,而不是生产人们不想要的口味想要,因为这只是浪费,不知道具体是谁在另一边购买,而你想在超市购买,一两个,或者有时你正在转移。但这些都是我们一直在寻找的东西,并且显然要面对这样的现实:嘿,数据将是不完整的。我们并不确切地知道,我们甚至不想确切地知道人们在日常生活中在做什么。我们想要的只是获得足够的数据,以便我们可以为消费者提供合适的产品。
劳雷尔:例如奶油奶酪和番茄酱,尤其是如果家里有孩子,它是您每天使用的产品之一。那么了解了这一切之后,卡夫亨氏如何为人工智能项目准备数据,因为这本身就是一个项目?那么,为人工智能做好准备的第一步是什么?
Jorge:我们非常成功的一件事就是我所说的数据聚餐方法。这意味着各个项目、各个小组都专注于提供非常具体的用例,这是正确的做法。例如,当您处理供应链中的一个项目时,您只是想说:“嘿,我想优化我的 CFR”,您实际上不会太关心销售人员想要做什么。但是,如果您实施聚餐方法,这意味着,好吧,您需要其他人的数据,并且您很可能可以提供数据,因为这是您用例的一部分。因此,聚餐意味着如果你想尝试别人的食物,你需要把自己的食物带到餐桌上。因此,如果你这样做,你的数据、你的企业数据就会开始变得越来越容易访问,如果你做得正确,最终你几乎拥有了很多、几乎所有的东西。
这是我强烈建议人们做的一件事。着眼大局,战略性思考,但采取战术性行动,行动时知道各个项目的范围将更加有限,但如果您围绕如何管理数据进行共享建立某些实践,那么每个单独的项目都将做出贡献更大的战略,而不是最大的战略成为单个项目的负担,如果这有意义的话。
劳雷尔: 当然。
Jorge:所以至少对我们来说,随着时间的推移,这已经相当成功了。因此,我们绝对和其他人一样面临数据挑战,但至少从我从其他人那里听到的情况来看,但卡夫亨氏在可用性方面处于有利位置。因为一旦达到一定的临界质量,最终发生的事情就是不需要带来额外的数据,你现在总是在重复使用它,因为数据很大但它是有限的。所以它不是无限的。它不会永远增长。如果你做得正确,你最终应该会发现,你不需要引入越来越多的数据。您只需要微调并真正利用您拥有的数据,可能更精细,并且可能更快地获取数据。这是一个很好的信号。我有数据,但我需要更快地获得它,因为我需要对其采取行动。太好了,您走在正确的道路上。围绕数据的相关成本也应该反映这一点。它不应该增长到无穷大。数据很大但有限。
Laurel:说到快速获取数据并利用数据,卡夫亨氏如何利用人工智能项目的计算能力和云扩展能力?您如何看待这两种策略的结合?
Jorge:毫无疑问,在过去几年中,这项技术已经取得了长足的进步,因为云提供的更多的是灵活性,并且它消除了我们过去的规模和性能方面的许多限制。举个例子,几年前我不得不担心“我的服务器中是否有足够的存储空间来托管我们获取的所有数据?” 如果我不这样做,我需要多长时间才能添加另一台服务器?有了云作为推动者,这不再是问题。只需几行代码,您就可以获得所需的内容。此外,特别是在数据方面,一些更现代的技术(例如 Snowflake 或 BigQuery)使您能够将计算与存储分开。实际上,它的基本含义是,人们不会为有限的计算能力而争斗。
因此,每个人的数据都可以是相同的,每个人都可以访问数据,而不必相互重叠,然后争论,哦,如果你运行这个,我就不能运行那个,然后我们就会遇到各种各样的问题,所以肯定会发生什么云让我们能够摆脱技术方面的限制。现在所有人工智能项目发生的一件伟大的事情是,现在你可以专注于实际交付你拥有的用例,而不必受到“我将如何扩展?”的限制。这已不再是这种情况。你必须担心成本,因为它可能会花费你一条胳膊和一条腿,但不一定是如何扩展以及扩展需要多长时间。
整个事情的敏捷性呈指数级增长,因为过去需要几个月的时间,现在可以通过代码在几秒钟内完成。因此,我确信,围绕分析和人工智能的所有这些爆炸式增长是如何可能的,因为云确实为所有这些左、右、中突然出现的举措提供了动力。
Laurel:说到这一点,你真的不能单打独斗,那么像印孚瑟斯这样的合作伙伴如何帮助引入这些新技能和行业知识,以帮助建立数据、人工智能、云以及任何未来事物的整体数字战略下一个?
Jorge:就像我认为云在这方面起到了推动者一样,我认为像印孚瑟斯这样的公司和合作伙伴也是这种推动者,因为在某种程度上,它们是我所说的专业知识的一部分生态系统。我认为现在没有任何一家公司能够独自做到这一点。你需要合作伙伴。您需要的合作伙伴既能带来新想法、新技术,又能为您所需的人员带来适当水平的专业知识,从全球意义上来说,至少对我们来说,拥有具有全球视野的人足迹很重要,因为我们是一家全球性公司。所以我想说,这与我们之前谈到的云作为推动因素是一样的:以印孚瑟斯等公司为代表的专家生态系统只是另一个关键推动因素,没有它,你将很难交付。所以这就是我可能会对现在正在倾听的人说的话,确保你的生态系统、你的专家生态系统良好并且正在蓬勃发展,并且你有合适的合作伙伴来做合适的工作。
Laurel:当您思考未来以及您在卡夫亨氏正在解决的所有这些难题时,像合成数据这样的东西对您的数据战略和业务战略有多重要?什么是合成数据?那么使用它来填补现实世界数据的空白有哪些挑战呢?
Jorge:就我们而言,现在我们不会使用大量合成数据,因为至少在数据方面有漏洞需要填补的领域,我们已经处理了一段时间了。因此,我们已经熟悉如何使用一些合成数据技术来生成和填补空白,但与其他组织的程度还不同。因此,在这种情况下,我们仍在寻找需要使用和利用合成数据的机会,但这对于卡夫亨氏和 CPG 来说并不是最重要的,我们和其他组织一样在多个地方广泛使用。
Laurel:最后,当你展望未来时,专注于数据的人工智能优先公司的数字运营模式会是什么样子?您对未来有何看法?
Jorge:我对未来的看法是,首先,不确定性,这意味着我认为我们无法准确预测将会发生什么,因为这个领域正在以我认为的速度增长和发展。老实说,仅仅因为重大的事情就让人眼花缭乱。我认为至少我要说的是,我们需要锻炼并做好准备的真正肌肉是适应性。这意味着我们可以学习、我们可以做出反应并应用所有新事物,希望它们以与它们发生相同的速度出现,并在新机会以敏捷的方式呈现时真正利用它们。但至少从如何准备的角度来看,我认为更多的是让组织、你的团队做好准备,真正采取行动,并准备好了解存在的具体业务挑战,并寻找任何新事物或可能正在发生的存在都可以应用于解决特定问题的机会。
我们是一家消费品公司,这意味着合适的产品、合适的价格、合适的位置,所以一切都归结为我如何利用今天可用的和明天可用的任何东西在这三个方面做得更好。但请继续关注,至少对我们来说,我们是一家消费品公司,我们在费城生产,我们生产番茄酱,我们养活人们。我们的使命是通过食物取悦人们。技术、人工智能或其他技术,是我们出色完成使命的工具。能够学习如何利用现有和未来,在正确的地点以正确的价格获得正确的产品,这就是我们的全部意义。
劳雷尔:那太棒了。非常感谢你,豪尔赫。我很高兴您今天和我们一起参加商业实验室。
豪尔赫:非常感谢。谢谢你邀请我。
此内容由《麻省理工科技评论》的定制内容部门 Insights 制作。它不是由《麻省理工科技评论》的编辑人员撰写的。