互联网资讯 / 人工智能 · 2024年5月15日 0

OpenAI发布全新旗舰模型GPT-4o:融合文本、图片和语音功能 免费提供

5月14日消息,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o,将免费提供给所有用户使用,并且未来几周内先向ChatGPT Plus用户推送。

OpenAI发布全新旗舰模型GPT-4o:融合文本、图片和语音功能 免费提供

GPT-4o中的“o”代表“oMni”(即全面、全能的意思)。据OpenAI介绍, GPT-4o是向更自然的人机交互迈出的一步:接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。

OpenAI发布全新旗舰模型GPT-4o:融合文本、图片和语音功能 免费提供

GPT-4o能在232毫秒内对音频输入做出反应,平均反应时间为320毫秒,这与人类在对话中的反应时间相近。它在英语和代码文本方面的性能与GPT-4 TuRbo相当,在非英语语言文本方面也有显著提高,同时在应用程序接口(API)方面速度更快,价格便宜50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。

据OpenAI介绍,使用GPT-4o时,ChatGPT免费版用户可以体验以下功能:体验GPT-4级智能;从模型和网络获取回复;分析数据并创建图表;就拍摄的照片进行聊天;上传文件以协助总结、撰写或分析;发现并使用GPT和GPT STore。

早在预热阶段,GPT-4o被OpenAI CEO AltMan形容为“感觉像魔法”。阿尔特曼在此前的采访中还曾表示,希望最终开发出一种类似于科幻电影《她》中的AI助理。

2013年上映的科幻电影《她》讲述了人类和AI谈恋爱的故事。作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了一个叫做“萨曼莎”的AI姑娘。当然这并不意味OpenAI想让我们和AI谈恋爱。

认证为前DCCI互联网数据中心创始人的胡微博大V胡延平EaRthRaMbleR评价称,“这是一次伪装成春季update的智能交互变革,貌似一小步的一大步。”

该大V表示,“百分百可以肯定不只是GPT4的后端能力+前端Chatbot聊天机器人,多模态自然交互这部分是GPT-5能力的选择性释放,OpenAI在控制节奏,不会也不愿一次性把GPT5全都放出来。”