【发现者网】12月25日消息,苹果公司在2023年10月与哥伦比亚大学的研究人员合作发布了一款名为"Ferret(雪貂)"的开源多模态大型语言模型(LLM),然而,当时这一消息并没有引起太多关注。这一举动让人工智能社区的许多专业人士感到惊喜,因为苹果一直以来都被视为一个相对“封闭”的公司。
据发现者网了解,欧洲的一家非营利组织,专注于医学领域的开源人工智能研究,代表Bart de Witte在社交媒体平台上表示:“我不知道怎么会错过这个消息,苹果在今年10月加入了开源人工智能社区。Ferret的发布显示出苹果对深远影响人工智能研究的承诺,巩固了它在多模态人工智能领域的领导地位。我期待有一天,本地大型语言模型(LLLMs)能够作为重新设计的iOS的一部分运行在我的iPhone上。”
科技博客作者和VentureBeat的撰稿人Ben Dickson在LinkedIn上写道:“2023年最令人意外的人工智能发展是什么?对我来说,这是苹果发布开源LLM(尽管是非商业许可)。”
Ferret以非商业许可证开源,目前不能用于商业目的,但有可能在未来被应用于苹果的产品或服务中。苹果的AI/ML研究科学家Zhe Gan在今年10月的一条推文中解释了Ferret的用途,称它可以“在一个图像中的任何地方、任何粒度上引用和定位任何事物”,这意味着它可以识别图像中的各种元素并将其标记出来。用户可以在图像中突出显示一只动物,并询问其种类,Ferret能够识别出该动物的种类并提供相关信息。此外,它还能够根据图像中其他元素的上下文提供更多的响应信息。
Ferret的发布对于研究人员来说具有重要意义,它表明苹果正在逐步开放其AI研究,这与过去苹果神秘封闭的形象形成鲜明对比。同时,苹果也面临着基础设施方面的挑战,虽然它正在增加自己的AI服务器数量,但与一些大型模型如ChatGPT相比,规模仍然有限。因此,除了与其他公司合作扩展其能力外,开源模型也成为苹果探索的一种途径。
Reddit的r/Apple版块用户发现Ferret在训练过程中使用了8个带有80GB显存的A100 GPU,这被认为是对英伟达的一种罕见认可,考虑到苹果过去与英伟达在GPU领域的合作关系。这一细节引起了人们的关注。