美股涨!油价涨!金价涨!发生了什么?
2024-05-16 23:57:54
GPT-4o让科幻电影《Her》走向现实?对新技术不应该产生过分乐观的预测和期望
美东时间 5 月 13 日,Open AI 正式发布了其最新的人工智能模型 GPT-4o,这一新品在业界引起了广泛关注。
GPT-4o 属于多模态大模型,支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出,该模型通过深度学习技术,能够生成更加自然、流畅的语言,并在多种语言处理任务中表现出色。OpenAI 表示,GPT-4o 的推出将进一步推动自然语言处理领域的发展,并在多个行业中发挥重要作用。
据 OpenAI 技术负责人穆拉迪(Mira Murati)介绍,GPT-4o 中的 o 代表 omni(全能),上述负责人表示,新模型允许 ChatGPT 处理 50 种不同的语言,速度和质量都有所提高,它还将通过 OpenAI 的 API 提供支持,这样开发者今天就可以开始使用新模型构建应用程序了。"GPT-4o 的速度是 GPT-4 Turbo 的两倍,成本只有一半。"
上述负责人还表示,新型号 GPT-4o" 速度快得多 ",在文本、视频和音频方面都有改进,公司最终计划让用户与 ChatGPT 进行视频聊天。" 这是我们第一次在易用性方面迈出巨大的一步。"
记者留意到,发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后,GPT-4o 几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。
此外,在人机交互的聊天过程中,GPT-4o 的语音功能不仅能 " 感知 " 对话者的情绪与状态,还可以相应的回应。同时,即便是对话过程中被打断,也能立刻跟进。数据显示,在音频输入层面,GPT-4o 相应速度达到了人类级别,最短 232 毫秒,平均 320 毫秒。
有业界人士形容,这是科幻电影《Her》走向了现实世界。
不过,在惊叹于 GPT-4o 强大表现的同时,不应该对新技术产生过分乐观的预测和期望。此前 Open AI 公司产品 Sora 发布时,文生视频一下子火爆整个朋友圈,但事后人们发现,Open AI 展示的 Sora 视频,全部都有人工特效参与。
更早以前,英伟达创始人兼首席执行官黄仁勋的 " 厨房视频 ",有报道称整个 " 元宇宙 " 视频中的 " 黄仁勋 " 都是算法生成的 " 假人 ",而真实情况是,该视频有 15 秒确是英伟达用机器生成的,以展示其 3D 仿真模拟平台,但其他内容都是人工制作的。
GPT-4o 的发布无疑是一个令人兴奋的消息,但在面对它的时候,也仍然应该保持审慎和理性的态度。
事实上,任何技术的发展都需要时间和实践的检验。GPT-4o 虽然在语言生成和理解方面取得了重要突破,但在具体应用中仍可能面临挑战。例如,在处理复杂语境、理解隐含意义以及跨文化沟通等方面,AI 模型仍有待提升。
此外,AI 技术的快速发展也引发了伦理和法律方面的讨论。如何在保护个人隐私和数据安全的前提下合理利用 AI 技术,是当前社会面临的重要问题。OpenAI 在发布 GPT-4o 时也强调了这一点,表示将致力于遵守相关法律法规,确保技术的合规使用。
技术的真正价值在于如何为人类解决实际问题,而不仅仅是追求技术上的新奇和先进。因此,我们期待 GPT-4o 能够在教育、医疗、客户服务等领域发挥积极作用,同时也希望 OpenAI 和其他科技企业能够持续推动 AI 技术的健康发展。
文|记者 沈钊
2024-05-16 23:57:54
2024-05-13 21:34:45
2024-05-13 21:32:30
2024-05-13 21:30:14
2024-05-13 21:27:58
2024-05-13 21:25:42
2024-05-13 21:23:27
2024-05-13 21:21:11
2024-05-13 21:18:55
2024-05-13 21:16:39
2024-05-13 21:14:24
2024-05-12 11:09:59
2024-05-12 11:07:43
2024-05-12 11:05:27
2024-05-12 11:03:12
2024-05-12 11:00:57
2024-05-12 10:58:39
2024-05-12 10:56:24
2024-05-12 10:54:07
2024-05-12 10:51:51