发布时间:2024-01-16 16:08:35 栏目:科技
如今,每个企业都希望利用人工智能 (AI),并且他们希望能够利用各种内容来实现这一目标 - 不仅仅是文本,还包括代码、视频、音频、图像(无疑还有更多内容)。
这使得多模态在企业人工智能市场中变得更加重要:也就是说,人工智能模型能够消化(更重要的是,为多种不同类型的输入提供有用的相关答案)。
人工智能提供商都在争先恐后地满足这一需求,并将自己打造为最新、最优秀的,谷歌也不例外。这家科技巨头今天加大了赌注,宣布推出供企业使用的新型多模式Gemini Pro。
就在这一消息发布一周前,该公司推出了其Gemini旗舰生成人工智能 (genAI) 模型,称其为最大且“最有能力”的模型,但该模型很快因其图像分析功能(或缺乏)而受到批评。
Gartner 副总裁分析师 Chirag Dekate 告诉 SDxCentral:“Gemini 是第一个原生多模式模型,它改变了游戏规则,并为衡量其他模型设定了新的基准。” “通过 Gemini,谷歌正在实现其作为人工智能优先公司的潜力。”
Gemini Pro API可通过 Google Cloud 的 Vertex AI 平台供企业使用,也可供 Google AI studio 中的开发人员使用。它包含专用的 Gemini Pro Vision 多模式输入,可接受文本和图像输入以进行文本输出。
云快进?人工智能、成本压力和新数据规则重塑 2024 年的格局。
使用 Gemini 构建和部署模型
谷歌的 Gemini 有三种尺寸:Ultra、Pro 和 Nano。Ultra 目前为特定客户提供私人预览版,Nano 可在 Android 中使用,Pro 可以在 Google 的 Bard 聊天机器人中找到。
Gemini Pro 既提供免费版本,供用户“在限制范围内”试用(即每分钟免费最多 60 次查询,用户输入的任何内容都将用于帮助进一步训练模型),也提供付费版本。即用型版本。“免费访问模型使所有消费者都能够评估和测试该模型的功能,”Dekate 说。
即用即付从每分钟 60 个查询开始,具有聊天、函数调用、嵌入、语义检索和自定义知识基础等功能。它支持 38 种语言以及 Python、Android (Kotlin)、Node .js、Swift 和 JavaScript。
希望扩大规模的企业可以通过 Google 的 Vertex AI 和 Google AI Studio 访问 Gemini Pro API。这将使他们能够构建强大的、具有内置安全防护栏的多模式人工智能模型。
免责声明:本文由用户上传,如有侵权请联系删除!