编辑 | Panken
10月18日消息,近日,微软AI CEO穆斯塔法·苏莱曼(Mustafa Suleyman)接受WIRED专访,详细解读了微软Copilot愿景、AI智能体(AI Agent)的三个阶段、微软与OpenAI的关系、AI后续挑战等焦点话题。
苏莱曼说,微软Copilot旨在创造一种伙伴间的持续互动体验,不仅关乎技术,更在于提供情感支持;AI智能体分为信息处理、长期记忆、交互三大阶段;微软对OpenAI的模型进行了微调,使其不仅专注于解决数学和科学问题,还能进行并列比较和消费者分析。
微软本月宣布其AI助手Copilot升级类似人类的声音、能看到用户的屏幕、拥有更好的推理能力。对此苏莱曼称,这都是让用户重新爱上PC的计划的一部分。
微软全球资深副总裁、微软AI亚太区总裁张祺博士总结了此次访谈的启示:
“2024年诺贝尔奖的各个奖项已经全部揭晓,令人瞩目的是,诺贝尔物理学奖与化学奖双双花落AI领域。AI技术及其应用成为今年诺奖最大的亮点。诺奖对AI相关成果及科学家的高度认可,不但有力地推动了AI技术的进一步发展和跨学科研究的深化,也预示着AI将以更快的速度推动人类社会的经济增长和高质量发展。
AI的发展速度惊人,这在人类历史上尚属首次——机器学会了运用我们的语言。但AI所提供的信息能否符合人类的认知需求和价值判断?AI能否真正理解语言背后的情感内涵?在AI与人类深度交互的背景下,如何确保数据和隐私安全?从长远来看,哪些挑战可能成为制约AI可持续发展的根本性因素?
在直面这些难题的同时,苏莱曼先生对如何最大限度利用技术满足用户需求给出了一个清晰的路线图。他探讨了人工智能的发展、伦理问题以及未来的技术前景。这正是本次苏莱曼先生采访带来的启示 。”
以下是穆斯塔法·苏莱曼与WIRED资深记者Will Knight的深度访谈实录:
一、Copilot目标提供情感支持,Vision功能完全保护用户隐私
主持人:Copilot的新愿景是什么?
穆斯塔法·苏莱曼:我们正处于一个惊人的转型点。AI伙伴现在能够看到我们所见,听到我们所听,并使用我们沟通的同一种语言。这种新的设计理念关注的是持久性、关系和情感。我正在打造一种体验,是关于与伙伴进行持久、持续互动。
主持人:你从Inflection AI加入微软,该公司专注于构建支持性和同理心的AI。听起来你把这种理念带到了新的雇主这里。
穆斯塔法·苏莱曼:我一直相信AI有提供支持的潜力。情感支持实际上是我19岁时开始工作的第一个项目,那时我启动了一项电话咨询服务。这正是这个技术时刻的美妙之处——体验与一个真正了解你的AI伙伴互动。它会指导你、鼓励你、支持你、教导你。我认为这将不再让人感觉像是在跟一台计算机互动。
主持人:Copilot Vision是什么?这个“实验室”功能将让Pro用户尝试到什么?
穆斯塔法·苏莱曼:Copilot Vision让你能够说“那边的东西是什么[在你的屏幕上]?”或“等一下,那是什么?你觉得那个怎么样?”在你坐在电脑前时,会有很多这样的小瞬间。这个AI伙伴可以看到你所见,并实时与你讨论你正在看的内容,这是非常了不起的。它在某种程度上改变了你在数字生活中的体验,因为你不必再费力输入内容。
主持人:这听起来像是Recall,那项有争议的、现在需要选择的Windows功能,用于记录用户屏幕上的内容。
穆斯塔法·苏莱曼:保护用户的隐私是至关重要的。目前我们不会用Copilot Vision保存任何内容,因此一旦会话结束后关闭浏览器,所有内容都会消失,完全删除。但我在思考是否以及如何在未来引入这一功能,因为很多人确实希望有这样的体验。
如果你可以说,“我前几天在网上看到的那张图片是什么?那个表情包是什么?”我想我们总有一天得研究这个问题。不过目前,Copilot Vision工具是这样的。我们需要随着时间进行实验,看看如何在这方面做更有意义的事情。
二、新功能类似于OpenAI“草莓”模型,针对消费者需求作调整
主持人:你们还推出了Think Deeper,这将使Copilot能够处理更复杂的问题。这是基于OpenAI的o1模型,也就是Strawberry,对吗?
穆斯塔法·苏莱曼:是的,类似于Strawberry。我们对OpenAI的模型进行了调整,为了更符合消费者的需求,我们让它以一种更符合AI伙伴主题的方式运行。
主持人:有什么区别?
穆斯塔法·苏莱曼:OpenAI的模型更专注于纯数学和科学问题的解决。我们试图让它专注于并列比较和消费者分析等内容。当你在解决一个难题时卡住了,想要推理时,它可以真正列出一个并列比较,或者进行大规模分析。
主持人:微软的人们已经在使用这个新版本的Copilot了吗?
穆斯塔法·苏莱曼:是的,大家都在使用。我们几天前刚在公司内部全面上线。所以每个人都在使用,并且提供大量反馈。我们的反馈渠道非常繁忙,这很有趣。
三、朝AI伙伴迈进一步,AI智能体三大阶段解读
主持人:人们会记得Clippy,微软最后一个Windows AI助手。那里的员工有看到相似之处吗?
穆斯塔法·苏莱曼:我前几天见到了比尔·盖茨,他说,你知道吗,你给整个AI的命名搞错了?应该叫Clippy(回形针)。这确实显示了盖茨这样的人的前瞻性。他们不仅能预见未来两年,还能预见未来二十年。
主持人:新功能是否是朝着所谓的AI伙伴迈进了一步,AI伙伴可以在电脑上帮你处理有用的琐事吗?
穆斯塔法·苏莱曼:是的,绝对是。
第一阶段是AI处理与用户相同的信息——看到用户所见、听到用户所听、阅读用户阅读的文本。
第二阶段是AI具备长期、持续的记忆,随着时间的推移建立起共同理解。
第三阶段是AI通过发送指令和采取行动与第三方互动——比如购买东西、预订东西、规划日程。
我们正在研发实验模式中的这两个功能。
主持人:你们有一个可以为你去购买东西的Windows AI智能体吗?
穆斯塔法·苏莱曼:这还有一段时间,但是的,我们已经形成了闭环,我们已经完成了交易 。这项技术的问题是,你可以让它在50%到60%的时间里正常工作,但要让它达到90%的可靠性还需要付出很多努力。
我已经看到了一些令人惊叹的演示,其中它可以独立启动并进行购买等等。但我也见过一些事故的时候,它不知道自己在做什么。
主持人:能多告诉我一点“事故”的事吗?它是否用盖茨的信用卡去买了辆兰博基尼?
穆斯塔法·苏莱曼:如果它用的是盖茨的信用卡,那就好笑了。但不,如我所说我们还在一步步摸索。这项技术仍然深处实验室的困境中,还有很长的路要走,但我想进展可以按季度来计算,而不是按年。
四、AI的未来挑战:打造可信赖技术,建立亲密和个性化体验
主持人:在实现你所描述的人工智能未来的过程中,你面临的最大挑战是什么?
穆斯塔法·苏莱曼:最大的挑战是找出如何打造可信的技术,因为这将是一种非常亲密和个人的体验。当然我们必须做好安全和隐私的部分。但我认为真正的关键在于设计对话,使AI伙伴能够明确边界,能够说出“这是我不准备参与的事情”。
如果我们能做到这一点,那就是建立可信体验的基础,然后我认为我们可以真正进入复杂的领域,例如如何让它代表你购买东西、代表你谈判、代表你签订合同,或者为你规划一个周六下午涉及三四个不同站点的日程。你会说,我相信你,Copilot,你能搞定,对吗?这正是我们正在努力实现的目标。
微软,WIRED