苹果推出了新的开源人工智能模型

发布时间:2024-05-17 10:33:18 栏目:手机

    导读 苹果终于加入了人工智能竞赛。这家总部位于库比蒂诺的科技巨头推出了新的开源大型语言模型 (LLM) OpenELM(开源高效语言模型),旨在直接在...

    苹果终于加入了人工智能竞赛。这家总部位于库比蒂诺的科技巨头推出了新的开源大型语言模型 (LLM) OpenELM(开源高效语言模型),旨在直接在设备上运行,而不是通过云服务运行。 OpenELM 模型目前可在著名的 AI 代码共享社区平台 Hugging Face Hub 上使用。

    苹果的 LLM 是一套八种语言模型,其中包括四种使用 CoreNet 库预训练的模型和四种指令调整的模型。该公司在这些模型中使用分层扩展策略,旨在优化准确性和效率。

    Apple 决定开源 OpenELM 模型,旨在通过最先进的语言模型增强和丰富研究社区。苹果表示,通过共享开源模型,研究人员不仅可以利用模型,还可以深入研究其内部工作原理,从而在自然语言人工智能领域取得更快的进展和“更值得信赖的结果”。

    研究人员、开发人员和公司可以按原样使用 Apple 的 OpenELM 模型,也可以对其进行自定义以满足特定需求。这种开放性也抛弃了以前的做法,即公司通常只提供模型权重和推理代码,而无法访问底层训练数据或配置。

免责声明:本文由用户上传,如有侵权请联系删除!