全文长度:2097字
预计阅读时间:7分钟
OpenAI 宣布了其最强的迷你版模型——GPT-4o mini。GPT-4o mini 支持文本、图像、音频和视频的多模态推理功能,是当前最先进的小模型之一。在美东时间周四,OpenAI 宣布这一新模型将免费上线,使得该技术成本达到了“几乎免费”的水平。GPT-4o mini 的商用价格为每百万输入 token0.15 美元,每百万输出 token0.6 美元,价格比此前的 Frontier 型号低了一个数量级,比 GPT-3.5 Turbo 便宜超过60%。GPT-4o mini 支持128K token的上下文长度。
GPT-4o mini的技术优势
根据OpenAI的介绍,GPT-4o mini具备处理文本、图像、音频和视频的多模态推理能力,被认为是目前最强大的多模态小模型之一,其性能甚至比GPT-4更为出色。GPT-4o mini在MMLU测试中获得了82%的得分,并且在LMSYS排行榜上的聊天偏好方面优于GPT-4。
由于这些原因,OpenAI表示,GPT-4o mini在文本智能和多模态推理领域的学术基准测试中,已超越了GPT-3.5 Turbo和其他小型模型,同时支持的语言范围也与GPT-4o相同。在函数调用方面,GPT-4o mini的表现也尤为突出,允许开发人员构建能够获取数据或与外部系统交互的应用程序。此外,与GPT-3.5 Turbo相比,GPT-4o mini的长上下文性能得到了显著提升。
测试数据表现
在涉及文本和视觉的推理任务中,GPT-4o mini的表现优于其他小型模型。
在MMLU测试中,GPT-4o mini的得分为82.0%,而谷歌的Gemini Flash为77.9%,Anthropic的Claude Haiku为73.8%。
在数学和编码方面,GPT-4o mini在MGSM测试中获得了87.0%的得分,Gemini Flash为75.5%,Claude Haiku为71.7%。
在衡量编码性能的Human Eval测试中,GPT-4o mini的得分为87.2%,而Gemini Flash为71.5%,Claude Haiku为75.9%。
在多模态MMMU测试中,GPT-4o mini的得分为59.4%,Gemini Flash为56.1%,Claude Haiku为50.2%。
技术参数
此外,GPT-4o mini支持128K token的上下文窗口,每个请求最多可以处理16K个输出token,并且其知识库更新至2023年10月。这些技术参数使GPT-4o mini在各种复杂应用场景中表现得游刃有余。
经济效益和定价策略
OpenAI 宣布发布其迄今为止最强大的迷你版模型——GPT-4o mini,该模型具备文本、图像、音频和视频的多模态推理能力,性能优于前代版本 GPT-4。GPT-4o mini 在 MMLU 上的得分为 82%,并且在 LMSYS 排行榜的聊天偏好方面也优于 GPT-4。这个新模型的商用价格为每百万输入 token 15 美分,每百万输出 token 60 美分,比之前的 Frontier 型号便宜一个数量级,比 GPT-3.5 Turbo 便宜60%以上。对此,OpenAI CEO 山姆·奥特曼表示,未来智能化的成本已经低到几乎可以忽略的地步。网友因此戏称,GPT-4o mini 是大模型中的“价格屠夫”。
定价方面
在定价方面,GPT-4o mini 的商用费用为每百万输入 token 15 美分,每百万输出 token 60 美分。举个例子,生成一本 2500 页的书只需要 60 美分。GPT-4o mini 支持128K token的上下文长度,每百万个输入 token 收费 0.15 美元,每百万个输出 token 收费 0.6 美元。OpenAI 指出,GPT-4o mini 运作成本显著低于先前版本,尤其比 GPT-3.5 Turbo 便宜60%以上。
OpenAI 计划在未来几天推出 GPT-4o mini 的微调版本。目前,GPT-4o mini 作为文本和视觉模型,已在 Assistants API、Chat Completions API 和 Batch API 中提供使用。在 ChatGPT 中,免费版、Plus 版和团队版用户从今天起将能够使用 GPT-4o mini 代替 GPT-3.5,企业用户也将在下周开始使用。
OpenAI 表示,他们很高兴能够继续引领潮流,并设想未来模型可以无缝集成到每个应用程序和每个网站上。GPT-4o mini 为开发人员铺平了道路,使他们能够更高效、更经济地构建和扩展强大的 AI 应用程序。AI 的未来将变得更加易于访问、可靠,并且嵌入到我们的日常数字体验中。近几年,人工智能飞速进步,成本也在大幅降低。OpenAI 举例称,自 2022 年推出功能较弱的模型 text-davinci-003 以来,到如今的 GPT-4o mini ,每个 token 成本已下降了 99%。
外媒 CNBC 报道,OpenAI 预计 18 日推出新版 AI 模型 GPT-4o mini,称其为当前功能最强大且最具成本效益的迷你版本。GPT-4o mini 预计将取代 GPT-3.5 Turbo,成为 OpenAI 现阶段提供的最小规模模型。GPT-4o mini 是 OpenAI 在多模态模型领域占领先地位的一大努力,通过这个工具可以生成包括文字、图像、音频及影像在内的多种类型 AI 内容。
OpenAI 致力于继续在降低成本的同时增强模型能力的道路上前进。
安全性与可用性
在安全方面,GPT-4o mini内置了多层过滤模式,可以有效减少不当内容的输出,包括色情、种族歧视等非法言论。同时,首次采用了指令层级结构来全面增强模型的安全性能。
GPT-4o mini的上下文窗口为128K个token,每个请求最多支持16K个输出token,并且模型的知识范围覆盖到2023年10月。
在ChatGPT平台上,免费版、Plus版和团队版用户从今天起就能使用GPT-4o mini来替代GPT-3.5。企业用户也将在下周开始体验这一新模型。
截至目前,GPT-4o mini已作为文本和视觉模型在Assistants API、Chat Completions API和Batch API中提供。
未来发展和应用前景
1. 探讨GPT-4o mini未来发展的潜力及其在各个领域的应用前景,揭示OpenAI未来的计划,如GPT-4o mini的微调版本及更多功能支持。
2. OpenAI计划在未来几天推出GPT-4o mini的微调版本。
3. 未来,GPT-4o mini可以无缝集成到各种应用程序和网站上,为开发者提供了构建和扩展强大AI应用的新途径,使之更加高效和经济。
4. AI的未来方向是更加易于访问、可靠,并深度嵌入我们的日常数字体验中。OpenAI正在致力于在继续增强模型能力的同时降低其成本。
5. GPT-4o mini是OpenAI在多模态模型领域的一个重要突破,通过这一工具,可以生成文字、图像、音频和视频等多种类型的AI内容。