竞争对手AI能力的激增令亚马逊措手不及。现在,打造Alexa的首席科学家罗希特·普拉萨德正带领公司奋起直追,重振AI雄心。
作为亚马逊Alexa的主要架构师之一,罗希特·普拉萨德(Rohit Prasad)一直处于人工智能(AI)的前沿。现在,他正带领公司努力在AI竞赛中奋起直追。
竞争对手AI能力的迅猛提升令亚马逊措手不及。因此,该公司希望普拉萨德升级Alexa语音助手的技术,并重振公司的AI雄心。
Alexa已集成到全球超过5亿台设备中,与苹果公司(Apple)的Siri和谷歌(Google)的Assistant一样,此前一直是占据主导地位的AI助手。然而,OpenAI发布了ChatGPT,AI竞赛的规则就此改变。
亚马逊组建了一个新的团队,安排了数千名员工,由普拉萨德领导,为Alexa升级的同时也为其他业务开发AI产品。该公司一直在构建自己的大语言模型(生成式AI背后的软件),花时间训练和微调这项强大的技术。
尽管预计亚马逊最早将于下个月推出一款搭载AI的全新Alexa,但据该公司内部人士透露,在追赶OpenAI、微软(Microsoft)、Alphabet旗下谷歌等更早专注研究新AI技术的公司方面,亚马逊还是面临不少困难。内部人士和业内分析师表示,亚马逊专有的AI模型仍落后于最大的几家竞争对手。
如果亚马逊不能重新夺回AI领域的优势,就有可能失去技术创新领头羊的地位。
投资银行D.A. Davidson的分析师吉尔·卢里亚(Gil Luria)表示:“就这一点而言,他们还不处于优势地位。”
亚马逊表示,该公司并未落于下风,而且要在AI领域打一场持久战。亚马逊认为,无论哪家公司的AI软件取得成功,鉴于这项技术需要密集的计算资源,该公司的云业务需求都将飙升。亚马逊首席执行官安迪·贾西(Andy Jassy)表示,预计AI将在未来几年为公司带来数以百亿美元计的收入。
亚马逊拒绝安排普拉萨德接受采访。该公司发言人表示,希望普拉萨德能够像领导语音识别技术进步那样,推动AI模型的开发。
现年48岁的普拉萨德长期以来一直宣称,构建交互式AI是一项具有挑战性的任务,尽管几十年来,此类AI的梦想一直出现在科幻小说、电影和电视剧中。
普拉萨德亚马逊2022年发布的一段视频中说:“这种与机器交流的需求出现在科幻小说中是有原因的。”
普拉萨德小时候在看电影《星际迷航》(Star Trek)时,第一次对会说话的计算机这一潜力产生了兴趣。最终,他成为机器自然语言理解方面的专家,并围绕这项技术建立了自己的职业生涯。他的这一背景非常适合在亚马逊工作。在21世纪10年代初,亚马逊就寻求打造一款能够理解和响应语音指令的虚拟助手。
2023年,普拉萨德的角色从Alexa首席科学家转变为领导公司最有抱负的技术团队。该团队力争在大语言模型和生成式AI领域展开竞争。生成式AI正是ChatGPT背后的技术。
本文基于曾参与亚马逊AI工作的人士的叙述撰写。
让Alexa更智能
亚马逊多年来一直致力于开发机器学习和其他形式的AI。尽管如此,该公司在构建生成式AI所需的大模型方面还是晚于竞争对手。生成式AI使用经过海量数据训练的软件来生成解决方案。这种技术可以进行对话,并响应复杂的指令。
在2022年底ChatGPT发布后的几个小时内,普拉萨德领导的Alexa团队就开始试用。ChatGPT的易用性以及提供各类知识的能力,都让普拉萨德的团队印象深刻。团队成员让ChatGPT为Alexa的智能家居控制等功能生成代码,其结果甚至有时比亚马逊内部系统的结果还要好。
普拉萨德随后召集员工开会,讨论ChatGPT可能对该行业产生的影响。几周之内,他们就制定了一个赶超计划。亚马逊加快了名为Titan的大模型开发,并启动了名为Olympus的新款模型。该公司计划使用其模型重新打造Alexa,并将其部署到其他业务中。
亚马逊将数千名员工调到普拉萨德领导的这个新团队,并将其命名为AGI小组,表明其最终开发通用人工智能(AGI)的雄心。AGI是能够超越人类的下一级AI。
亚马逊一年前展示了一款更智能的Alexa。这次升级在公司内部被称为Remarkable Alexa,其公开发布的时间比预期要晚。当然,对于尖端技术来说,新产品的开发延迟并不罕见。
处理基本和复杂的任务
据内部人士透露,对于应对紧迫的最后期限并让公司创建的AI正常工作,普拉萨德的团队困难重重。目标经常发生变化,最后期限又很紧迫,而且事实证明,该团队有时反倒因为规模过大而无法快速创新。
在ChatGPT热潮到来前,亚马逊一直在增加Alexa可以处理的任务,使这款语音助手能够在各种产品之间无缝衔接,并试图围绕它建立一项有利可图的业务。亚马逊已将Alexa应用到汽车、微波炉甚至眼镜中。
普拉萨德在Alexa方面的专长是自然语言理解和准确性,在回答“今天天气怎么样?”等常见问题时,Alexa的答案几乎没有瑕疵。在ChatGPT出现之前,在大语言模型和Alexa上没有什么太多工作可以做。
在使用最新的内部AI模型彻底改造这款语音助手方面,亚马逊始终难有建树。随着亚马逊将大语言模型融入Alexa,这款语音助手在处理简单任务方面的可靠性却降低了。举例来说,让Alexa打开灯的可靠性本在90%以上,但现在,Alexa却在一些测试中丧失了这一能力。
对于最新AI项目的延迟和故障排除等问题,亚马逊发言人不予置评。
普拉萨德在去年的一次采访中表示,生成式AI的创造性和对话能力可能会妨碍其执行基本任务的可靠性。
在YouTube上发布的一段采访中,普拉萨德对一位分析师表示:“如果你走进来对它说,‘Alexa,我觉得这里很热’或‘我觉得这里太热了’,它应该会反问你,‘你想调低恒温器还是降低温度?’但它不应该告诉你去海滩。”“这就是为什么AI是这么难的一个问题,因为语境至关重要。”
内部技术
与许多科技公司一样,亚马逊原本更倾向于开发自己的技术,从而完全掌控其产品和服务。但随着AI竞赛的推进,该公司越来越倚重合作伙伴关系。亚马逊向AI初创公司Anthropic投资了40亿美元,最近又从Adept AI Labs聘请了员工。该公司还与Meta Platforms和其他公司建立了合作。
虽然亚马逊本来计划依靠自己的模型来打造Remarkable Alexa,但后来还是决定整合Anthropic和其他公司的AI技术。
亚马逊计划在未来10年斥资超过1,000亿美元建设数据中心,以满足AI需求,因此,生产自主AI产品的内部压力也就越来越大。与通常情况相比,首席执行官贾西更多地参与了AGI团队的工作。他大约每四到六周就会与该团队的领导层开一次会。
亚马逊正打算举办一场活动,展示新的设备升级,其中可能会重点介绍Alexa的一些升级功能。该公司计划推出一款对话能力更强的Alexa,可以帮助用户起草信息并提供购物建议。亚马逊还考虑对更智能的Alexa版本收费。
亚马逊的竞争对手也在陆续推出聊天机器人并升级现有功能。
苹果公司最近推出了Apple Intelligence系统,其中包含增强版的Siri语音助手。该系统将搭载在苹果的新款iPhone 16系列机型上。谷歌最近也为手机推出了一款新的生成式AI助手。
Enjoyed this article? Sign up for our newsletter to receive regular insights and stay connected.
