每个人都知道苹果在Apple Intelligence方面正在追赶。随着OpenAI的发展、谷歌的发展以及新来者的出现,该公司的航运人工智能模型似乎远远落后于前沿。
我确信苹果正在竭尽全力打造更好、更现代的机型,我们将在六月份的WWDC上详细了解这一努力。但苹果智能的推出最让我困扰的并不是苹果被人工智能炒作列车措手不及,正在努力追赶-而是苹果对人工智能功能的实施也让人感觉草率和仓促。
苹果不一定要拥有最好的大型语言模型来赢得人工智能战争。它可以处于最佳状态,也可以与领导者合作以获得所需的东西。但它在苹果独特的部分不会失败:以我们所有人对苹果的期望,让这些功能变得令人愉快。目前,这就是苹果失败的地方。
苹果在人工智能最糟糕的情况下的最佳镜头
人工智能最糟糕的事情是,由于它大部分源于基于文本的语言模型的概念,因此人工智能界面往往是空的文本框,您必须在其中输入一些内容。我不敢相信我们又回到了这里。这是1984年之前的严肃思考,40年后,苹果将命令行界面的核心置于了赌注。
为用户提供一个空文本框并期望他们知道该说什么才能得到他们想要的结果是一个巨大的用户界面失败。空文本框是残酷的。(And不,必须通过语音小心地发出抽象命令并不是一个好的选择,强迫用户通过额外的文本输入费力地纠正错误的输出也不是一个好的选择。)
人工智能功能的未来需要建立在良好的用户界面设计之上,该设计提供简单的视觉工具来引导用户完成该过程。这是苹果真正能够留下印记的地方,我很高兴地报告,它在一个领域确实做到了这一点:图像生成。
Image Playground可能会制作一些有问题的图像,但苹果在该应用程序的UI方面走在了正确的道路上。Foundry
我不是Image Playground生成的图像的粉丝,但我必须赞扬苹果公司在其图像生成模型之上设置的界面。当您使用Image Playground或创建Genmoji时,Apple提供了一个适当的界面,该界面在包括用于说明的文本框的同时,还提供了一系列选项,您可以滚动并点击这些选项以向派对添加不同的建议和风格。您在文本框中输入的内容将被标记为浮动元素。这是一个实际的界面,而且效果很好。用户不需要知道图像生成模型在表面之下是如何运行的。让我们拍照就行了。
然后是剩下的
图像生成界面确实是苹果对人工智能设计的最佳表现。不幸的是,其他Apple Intelligence界面元素的表现并不太好。事实是,我不认为macOS 15和iOS 18暴露了苹果在人工智能方面的落后程度,而是暴露了苹果设计师为所有人工智能创建适当的界面的时间有多短。
让我们以Writing Tools为例,它可以校对、重写和修改文本。在Mac上,Apple的API和应用程序具有现有的拼写和语法检查系统,该系统提供浮动调色板,让您浏览所有错误。在其所有平台上,拼写错误和语法问题都可以加线,然后点击进行更正。
写作工具似乎与这个系统并行移植。正如Pixel Envy的Nick Heer指出的那样,它“表现为一个弹出窗口,[它]的工作有点像上下文菜单,有点像面板,但两者都做得很成功。”
不仅是写作工具界面脆弱和混乱,但它没有集成到任何其他文本工具,苹果已经内置到其操作系统多年!在这里,我们可以真正看到苹果的工程师和设计师如何在第一年就急于实现尽可能多的Apple Intelligence功能。
基于人工智能的写作工具应该被整合到苹果的拼写和语法的整体方法中,但相反,它们被推入了自己的筒仓。因此,它们缺乏人们可能期望的许多细节-例如,当您要求Writing Tools校对或重写某些内容时,它只是更改您的文本,然后让您在编辑和未编辑的文本之间切换。
基于人工智能的写作工具本应集成到苹果的整体拼写和语法方法中,但它们却被推入了自己的筒仓中。
与现有的人工智能校对应用程序Grammarly相比,Grammarly(即使在Mac上非常有限的Grammarly桌面版本)会强调您选择的文本编辑器中的错误,在您单击或点击时显示建议的更改,并显示具有删除线和颜色突出显示的段落长编辑以指示更改。
现在锤子,以后锤子
有句名言是,当你有一把锤子时,所有问题都看起来像钉子。很明显,当苹果开始其崩溃计划将Apple Intelligence添加到其操作系统中时,目标不是解决用户问题,而是在任何可能的地方插入人工智能功能。这与苹果解决问题而不是采用最新技术的一贯理念背道而驰,而且它以一些引人注目的方式激怒了该公司。
最明显的是它使用LLM来总结通知,包括新闻更新。许多应用程序(包括新闻应用程序)发送太多通知,如果用户的手机能够缓解痛苦,那将对用户有帮助。
我确信苹果的软件人员多年来一直在讨论这个问题。他们可以通过多种方法来解决这个问题,包括为通知中心构建一个新的界面元素,将多个气泡合并为一个气泡。每个通知附带的优先级分数将允许苹果选择排名前几的通知来显示,并通过一个新的界面来展开其余通知。
有很多方法可以解决这个问题--不仅适用于新闻应用程序,也适用于其他类型的应用程序,例如安全摄像头和智能锁。然而,其中大多数都很复杂,涉及修改通知中心界面或苹果的推送通知云服务。他们甚至可能要求第三方应用程序的开发人员采用它们。简而言之,这需要时间。
相反,苹果公司匆忙行事:鉴于推出人工智能功能的动力,它将一个爱管闲事的总结LLM推入了通知中心。这可能不是这项工作的错误工具,但苹果工程师得到的只是一把锤子。
距离下一轮Apple Intelligence功能的推出已经不多了。苹果会继续其鲁莽、混乱的冲刺来追赶,还是会尝试更加谨慎一点Apple Intelligence的第一波功能非常粗糙,迫切需要一些打磨和重新考虑。他们会明白吗?或者我们会多年来一直与半生不熟的写作工具生活在一起,因为责任方已经转向下一个匆忙的专题发布
Image Playground的实现给了我一些希望,即苹果在构建人工智能方面仍然理解其最大的优势:专注于让用户的生活更轻松。但苹果智能的其他部分让我非常担心,我们将迎来混乱的几年。