高级语音模式GPT-4o
据OpenAI介绍,高级语音模式能提供毫不延迟的实时对话,允许用户随时打断,并能感知和响应用户的情绪。“给予实时响应”与“打断对话”,这两项是目前语音助手公认的技术难点。
据了解,语音模式将于今年秋季向所有ChatGPT Plus用户开放。
OpenAI正在提高模型检测和拒绝某些内容的能力,该公司表示“通过逐步推出,我们可以密切监控使用情况,并根据实际反馈不断改进模型的能力和安全性。”因此,语音模式的初期功能仍有部分限制。例如,ChatGPT将无法使用计算机的视觉功能,该功能旨在让聊天机器人通过智能手机的摄像头对用户的舞蹈动作提供语音反馈。
目前GPT-4o语音模式可使用四种预设声音:Juniper、Breeze、Cove和Ember,这些声音由与付费的配音演员合作的。
此前,ChatGPT一款名为Sky的女性配音被指与好莱坞明星斯嘉丽·约翰逊十分相似。在收到约翰逊团队的律师函后,OpenAI暂停使用Sky语音。
OpenAI还表示,它已引入了新的过滤器,以确保软件能够发现并拒绝某些生成音乐或其他形式的受版权保护的音频的请求。对于OpenAI这类公司而言,避免陷入法律纠纷已逐渐成为需要警惕的事项。
小型AI模型GPT-4o mini
就在不到半个月前,OpenAI才发布了其旗下的AI模型GPT-4o mini。
GPT-4o mini,是一种具有成本效益的小型AI模型,旨在使其技术更实惠,能源密集度更低,使这家初创公司能够瞄准更广泛的客户群。
主打低成本和快速响应能力的 GPT-4o mini 适用于多种应用场景。
例如,它可以支持需要连续或同时调用多个模型的应用程序(如同时调用多个 API),能够处理大量上下文信息(如完整的代码库或对话记录),以及通过快速实时的文本回复与客户进行互动(如客户服务聊天机器人)。
具体来说,GPT-4o mini目前在 API 中提供了文本和图像处理功能,后续还将逐步增加对视频和音频的支持。
该模型能够处理多达 128K token 的长上下文,知识库截止日期为 2023 年 10 月份,并且对非英文内容的支持更友好。
该模型资源占用更低、运行成本也更低,让开发者能够集成该模型为更多用户提供人工智能服务。
对开发者来说,GPT-4o mini版的发布是个重磅消息,因为其调用成本为每百万 tokens 输入为 0.15 美元、每百万 tokens 输出为 0.6 美元,这个价格比 GPT-3.5 Turbo 便宜很多。
对普通用户来说,GPT-4o mini版也是个利好,使用者可以在 ChatGPT 里免费使用该模型,OpenAI称从发布之日开始 ChatGPT免费版用户、ChatGPT Plus订阅用户和 ChatGPT Teams用户都可以使用 GPT-4o mini版。
搜索引擎SearchGPT
而就在不到一周前,OpenAI宣布旗下AI搜索引擎SearchGPT开放内测。据悉,SearchGPT目前仅开放给了1万名内测用户,但公司称很快就会广泛推出。
SearchGPT是一个由人工智能驱动的搜索引擎。有媒体评论称,这是OpenAI意在挑战谷歌作为全球搜索引擎领先地位的一项重要战略举措。
OpenAI表示,SearchGPT将针对使用者的查询,提供附有来源连结的综合搜寻结果。使用者也可以提出后续问题,并获得符合情境的回应。市面上AI搜寻引擎在推出后都遇到可靠性和抄袭方面争议。OpenAI将让出版商进入相关工具,管理他们在SearchGPT搜寻结果中显示的内容。
但就在该公司官方演示时,一位用户要求在八月在北卡罗来纳州的一个小镇举办音乐节。据媒体报道,该系统给出了答案,但日期错误,告诉用户音乐会将在8月举行,而实际上那是票房关闭的时间。
“这是一个初步的原型,我们将继续改进它,”OpenAI当即表示。
从技术角度看,“AI幻觉”(即AI编造语句通顺但事实逻辑错误的答案)仍是业界的一大难题。
OpenAI组合拳
OpenAI今年还积极参与各种合作。
首先包括与出版商和各种创作者合作来壮大生
都与该公司签署了内容授权协议。
《大西洋月刊》行政总裁汤普森周四在OpenAI的社交媒体上指出,AI搜寻将成为民众「浏览网络的关键方式之一」,这项技术必须尊重和保护新闻业和出版商,并表示乐见OpenAI与自己合作。
OpenAI还与苹果积极合作。苹果产品的语音助手Siri能够在ChatGPT的帮助下完成数百项任务。苹果的软件工程高级副总裁克雷格·费德里吉表示,“苹果人工智能”(Apple Intelligence)将AI模型“置于iPhone、iPad和Mac的核心”,并“在每一步保护您的隐私”。
OpenAI首席执行官萨姆·奥尔特曼在一篇社交媒体帖子中表示,他“非常高兴”能与苹果公司合作,以将ChatGPT整合至其产品中。
在经历了高速成长的一年,OpenAI作为AI先驱企业的优势正在缩小。许多竞争对手正在迎头赶上,就在几天前,美国科技巨头Meta也推出了迄今为止性能最强大的开源大模型——Llama 3.1 405B(4050亿参数),同时发布了全新升级的Llama 3.1 70B和8B模型版本。
接下来OpenAI会如何发展?让我们拭目以待!
本文链接:https://joeyce.com/chatgpt/269.html
如何注册chatgpt4账号chatgpt4如何联网查询资料chatgpt4.0安卓怎么用人工智能chatgpt4.0 应用展示微软chatgpt4使用方法优秀chatgpt4.0提问案例chatgpt4官网中文版chatgpt4.0有多强