谷歌为企业发布新的多模式人工智能工具

发布时间：2024-01-16 16:08:35 栏目：科技

导读如今，每个企业都希望利用人工智能 (AI)，并且他们希望能够利用各种内容来实现这一目标 - 不仅仅是文本，还包括代码、视频、音频、图像(

如今，每个企业都希望利用人工智能 (AI)，并且他们希望能够利用各种内容来实现这一目标 - 不仅仅是文本，还包括代码、视频、音频、图像(无疑还有更多内容)。

这使得多模态在企业人工智能市场中变得更加重要：也就是说，人工智能模型能够消化(更重要的是，为多种不同类型的输入提供有用的相关答案)。

人工智能提供商都在争先恐后地满足这一需求，并将自己打造为最新、最优秀的，谷歌也不例外。这家科技巨头今天加大了赌注，宣布推出供企业使用的新型多模式Gemini Pro。

就在这一消息发布一周前，该公司推出了其Gemini旗舰生成人工智能 (genAI) 模型，称其为最大且“最有能力”的模型，但该模型很快因其图像分析功能(或缺乏)而受到批评。

Gartner 副总裁分析师 Chirag Dekate 告诉 SDxCentral：“Gemini 是第一个原生多模式模型，它改变了游戏规则，并为衡量其他模型设定了新的基准。” “通过 Gemini，谷歌正在实现其作为人工智能优先公司的潜力。”

Gemini Pro API可通过 Google Cloud 的 Vertex AI 平台供企业使用，也可供 Google AI studio 中的开发人员使用。它包含专用的 Gemini Pro Vision 多模式输入，可接受文本和图像输入以进行文本输出。

云快进?人工智能、成本压力和新数据规则重塑 2024 年的格局。

使用 Gemini 构建和部署模型

谷歌的 Gemini 有三种尺寸：Ultra、Pro 和 Nano。Ultra 目前为特定客户提供私人预览版，Nano 可在 Android 中使用，Pro 可以在 Google 的 Bard 聊天机器人中找到。

Gemini Pro 既提供免费版本，供用户“在限制范围内”试用(即每分钟免费最多 60 次查询，用户输入的任何内容都将用于帮助进一步训练模型)，也提供付费版本。即用型版本。“免费访问模型使所有消费者都能够评估和测试该模型的功能，”Dekate 说。

即用即付从每分钟 60 个查询开始，具有聊天、函数调用、嵌入、语义检索和自定义知识基础等功能。它支持 38 种语言以及 Python、Android (Kotlin)、Node .js、Swift 和 JavaScript。

希望扩大规模的企业可以通过 Google 的 Vertex AI 和 Google AI Studio 访问 Gemini Pro API。这将使他们能够构建强大的、具有内置安全防护栏的多模式人工智能模型。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

猜你喜欢

最新文章

头条推荐

热点文章

点击排行