OpenAI 即将发布强大开源模型,Altman 重磅预告:GPT-5 迈向全模态时代!

eca0579f9320250625134703

OpenAI 执行长 Sam Altman 近日在与 Y Combinator 总裁 Garry Tan(陈嘉兴) 的深度对谈中,曝光了一系列 OpenAI 最新动向,涵盖:

  • 一款即将开放的 强大开源模型

  • GPT-5 的发展方向与多模态能力

  • AI 成本革命带来的创新潜力

  • 未来智能体(AI Agents)演化蓝图

  • 对创业者的深度建议与方向指引

这场对谈不仅揭示了 OpenAI 的技术布局,也传递出 AI 即将加速进入新纪元的明确信号。


 GPT-5 邁向真正的「多模態」AI

22c78d1bc520250625134903

Altman 透露,GPT-5 将在 2024 年夏季正式亮相。这款新模型不仅继承 GPT-4 的强大能力,还将进一步拓展输入与输出形式,迈入「全模态 AI」阶段。

GPT-5 预计支持多种交互方式,包括:

  • 语音输入输出

  • 图像理解与生成

  • 程式码分析与编写

  • 视频生成与处理

虽然 GPT-5 仍未达成 OpenAI 对“通用人工智能(AGI)”的终极构想,但 Altman 明确表示:它将成为实现「真正多模态 AI」的关键一步


即将开放的开源模型:性能超出预期,可本地运行

除了 GPT-5,Altman 还首次预告了 一款即将开源的强大 AI 模型。该模型具备以下特性:

  • 性能将超出业界当前预期

  • 支持在本地设备上运行

  • 完全开放源代码,推动 AI 普及

这代表 OpenAI 正在突破此前「闭源为主」的路线,拥抱开放生态,释放更多 AI 基础能力给开发者、研究者与企业。

Altman 表示,这将有助于 加速 AI 应用的本地化落地与定制开发,并推动边缘计算与隐私保护的发展。


 AI 成本剧降,潜力远未被释放

Altman 指出,目前许多用户还低估了现有模型(如 GPT-3)的真正能力,AI 实际上已经远远超过了大多数产品所呈现的上限。他称之为“能力溢出”(Capability Overhang)。

尤其令人瞩目的是,AI 使用成本正迅速下降。以 GPT-3 为例,仅在一周内,其计算成本已下降 5 倍。Altman 认为,这种趋势将释放出大量之前因成本限制而无法实现的应用场景,带来新一轮创新浪潮。


ChatGPT 的「记忆功能」正改变人机交互

在对谈中,Altman 也特别提及 ChatGPT 正在开发的 记忆功能。这将使 AI 从一次性对话工具演进为:

  • 可跨设备同步的「持续型助理」

  • 能整合用户资料与历史偏好的智能伴侣

  • 类似“个人操作系统”的存在,理解并支持用户生活中的各种任务

这将极大增强用户黏性与实用性,改变现有的人机交互方式。


2025:智能体(AI Agents)元年即将到来

OpenAI 总裁 Greg Brockman 曾将 AI 智能体(Agent)定位为「L3 级别 AGI」——能够像一位初级员工一样,在电脑前执行多步骤任务、长时间独立操作。

Altman 预测,2025 年将成为 AI 智能体的元年,企业中大量重复性办公任务将由这类智能体自动完成。他还提出 AGI 的五个发展等级:

等级能力描述
L1基础对话者(聊天)
L2推理者(复杂理解)
L3行动者(执行任务)
L4创新者(自我创造)
L5组织者(协调多模型与系统)

目前,OpenAI 正加速从 L2 向 L3 的跃迁。


 Altman 对创业者的建议:别复制 OpenAI,聚焦痛点与差异化

面对当前 AI 创业热潮,Altman 提醒创业者:

“现在是科技史上最好的创业时机之一,但不要急于复制 OpenAI。”

他认为,AI 的影响将远超当年的电晶体革命,足以重塑整个人类社会的运作方式。创业者应聚焦那些尚未被解决的问题,在特定领域中打造具备 护城河与差异化优势 的产品。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。