ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步
2024-05-14 14:48:00 人浏览

来源:极客公园(ID:geekpark)

作者:黎诗韵

5 月 13 日,OpenAI 用一场春季发布会,再次搅动了整个 AI 行业。

在 Sam Altman 缺席的情况下,OpenAI CTO Mira Murati 担纲介绍了新的 ChatGPT 产品 ChatGPT-4o。

短短 26 分钟的发布会,却几乎是科幻电影《Her》的现实演绎。当你打开 ChatGPT,你面对的不再是一个只会帮你生成内容、或者进行僵硬语音聊天的工具——你唤起的将是一个「无所不能」的语音助手,或者说,一个越来越接近人类的「物种」。

它长出了「眼睛」,可以通过摄像头看到你,比如它通过研究员上扬的嘴角判断他的心情、通过他周围的环境背景判断了他正在做什么、甚至给出了造型建议;它能「看到」你的电脑桌面,直接帮你查看写的代码有什么问题。

它有了更灵敏的「耳朵」,能听懂的不只是语言,还能听懂研究员过于急促的呼吸声,并引导他慢慢平稳呼吸、放松下来。

OpenAICTO Mura Murati 宣布推出 ChatGPT-4o | 图片来源:OpenAI

它有了更灵活的「嘴巴」,对话不再有延时,你能随时打断它、它能随时接住你的话。它的声音能带入感情,比如更冷静一点、更激昂一点、甚至讽刺一点。它还能唱歌。

它也有了更聪明的「大脑」。它能帮研究员一步步解不等式,还可以做同声翻译、你可以通过它跟不同语种的人们交流。

这些强大的能力背后,源自 OpenAI 推出的新模型 GPT-4o。与现有模型相比,GPT-4o 的最大进步在于,它可以实时对音频、视觉和文本进行推理——换句话说,它让ChatGPT实现了真正意义上的多模态交互。

这不仅仅是技术进步的追求,更是应用普及的追求。OpenAI 的使命之一是让 AI 普惠每个人,让用户能顺滑地用上 AI 是至关重要的。在「模型即应用」的时代,这种交互体验最终还是靠模型能力的提升。OpenAI 称,GPT-4o(「o」代表「omni」)是迈向更自然的人机交互的一步。

发布会上,Mira Murati 宣布 ChatGPT-4o 将免费向所有用户开放,而付费和企业用户,可以抢先获得体验。

电影《Her》上映于 2013 年,它讲述了一位人类爱上一位人工智能语音助理的故事。从今天 ChatGPT 呈现的能力来看,这样的想象正在加速成为现实。

ChatGPT 的惊人进步:变身人类「超级助理」,甚至不需要人类参与

在 OpenAI 的官网上,呈现了 ChatGPT 作为个人语音「超级助理」的更多惊人应用场景。

首先是面向单个用户,和人一样,它提供的主要是「情绪价值」与「认知价值」。比如它能讲笑话、唱生日快乐歌、玩游戏、逗小狗、给人催眠、让人放松等等;它能充当面试官,给人提供面试建议;它还能给一位盲人提供环境观察,给他讲述看到的景色、提醒他过马路的路况。

分享本资讯链接: - 南瓜财经
声明:本文版权归原作者所有,发布此文为传递更多市场信息,不代表南瓜财经的观点和立场,请自行参考。如作者信息标记有误,请第一时间联系我们处理!

回顶部