红杉资本:生成式 AI 进入第二阶段

红杉资本发布一份报告,总结了这一年生成式 AI 突飞猛进的发展,探讨了生成式 AI 的发展趋势和市场表现。

一年前他们发布了一份预测,一年后红杉总结之前的预测,发现了他们预测正确和错误的部分:

预测错误的部分:

1. 事情发展得很快。他们原以为需要近十年的时间才能实现实习生级别的代码生成、好莱坞质量的视频或不听起来像机器的人类语音。但现实是,技术发展的速度超出了他们的预期。

2. 供应端的瓶颈。他们没有预见到用户需求会超过 GPU 供应的情况。许多公司的增长瓶颈不是客户需求,而是获取 Nvidia 的最新 GPU。

3. 垂直分离尚未发生。他们认为 “应用层” 公司和基础模型提供商之间会有一个分离,但实际上这种分离尚未清晰地发生。

4. 竞争环境的激烈和现有公司的迅速响应。市场上的某些领域(如图像生成和文案写作)竞争激烈,而现有公司的快速响应加剧了竞争压力。

5. 壁垒在客户而不是数据中。他们预测最好的生成式 AI 公司可以通过数据飞轮获得持续的竞争优势,但实际上数据的壁垒并不稳固。

预测正确的部分:

1. 生成式 AI 是一个事实。突然之间,每个开发者都在开发生成式 AI 应用,每个企业买家都在要求它。

2. 第一个杀手级应用已经出现。例如,ChatGPT 成为了最快达到 1 亿 MAU 的应用。

3. 开发者是关键。开发者首先的公司如 Stripe 或 Unity 的核心见解是,开发者的接入可以打开你甚至无法想象的用例。

4. 形式因子正在演变。AI 应用的第一版本主要是自动完成和初稿,但这些形式因子现在正在变得更加复杂。

5. 版权、伦理和存在的恐惧。在这些热门话题上,辩论持续不断。

新兴的产品蓝图 (Emerging Product Blueprints):

随着新兴技术的应用,未来的 AI 产品将更加符合用户的需求和期望。这些趋势显示了 AI 产品将变得更加智能、自主和用户友好,为用户提供更加丰富和高效的体验。

1、生成式接口:基于 LLM 的文本型对话用户体验是默认的接口。逐渐地,新的形式因素正在进入武器库,从 Perplexity 的生成式用户界面到 Inflection AI 的新的人声模式。

随着技术的进步,不仅仅是文本,还有其他形式的生成式用户界面和人声模式正在出现。这意味着未来的 AI 产品将提供更多样化的交互方式,使用户体验更加丰富和自然。

2、新的编辑体验:从 Copilot 到 Director’s Mode。传统的编辑工作流程正在发生变化。生成式 AI 不仅仅是为用户提供自动完成或初稿,现在它们提供了更多的控制和定制选项。

例如:Midjourney 的新的平移命令和 Runway 的 Director’s Mode 创造了新的相机般的编辑体验。Eleven Labs 使通过提示操作声音成为可能。

3、日益复杂的代理系统:生成式 AI 应用程序的能力正在扩展。它们不再仅仅是为人类提供答案或建议,现在它们有能力自主解决问题,访问外部工具,并代表用户完成任务。这意味着 AI 产品将更加智能和自主,能够为用户提供更多的帮助。

4、系统范围的优化:AI 的能力不仅仅是提高个体的效率,还可以优化整个系统。例如,AI 可以自动处理支持票据或拉取请求的部分内容,使整个系统更加高效。

AI 产品开发中的努力和创新,以及行业中共享的策略和技术的发展。

生成式 AI 领域的最新技术和工具的进展。这些进展使得 AI 模型更加强大、灵活和实用,同时也为开发者提供了更多的资源和工具来创建高质量的 AI 应用。这也意味着,随着这些技术和工具的应用,未来的 AI 产品将更加智能、准确和有用。

模型开发栈 (The Model Development Stack):

1、新兴的推理技术:如 chain-of-thought、tree-of-thought 和 reflexion 正在提高模型执行更丰富、更复杂的推理任务的能力,从而缩小了客户期望与模型能力之间的差距。开发者正在使用像 Langchain 这样的框架来调用和调试更复杂的多链序列。

2、迁移学习技术:如 RLHF 和 fine-tuning 变得更加易于访问,特别是考虑到 GPT-3.5 和 Llama-2 的 fine-tuning 的最近可用性,这意味着公司可以将基础模型适应到他们特定的领域,并从用户反馈中改进。开发者正在从 Hugging Face 下载开源模型,并进行微调以实现高质量的性能。

3、检索增强生成:为业务或用户引入上下文,减少幻觉并增加真实性和实用性。像 Pinecone 这样的公司提供的向量数据库已经成为 RAG 的基础设施支柱。

4、新的开发者工具和应用框架:为公司提供可重用的构建块来创建更高级的 AI 应用,并帮助开发者评估、改进和监控生产中的 AI 模型的性能,包括像 Langsmith 和 Weights & Biases 这样的 LLMOps 工具。

5、AI-first 基础设施公司:如 Coreweave、Lambda Labs、Foundry、Replicate 和 Modal 正在解构公共云,并提供 AI 公司最需要的东西:大量的 GPU,价格合理,随需应变且高度可扩展,具有良好的 PaaS 开发者体验。

这些技术应该可以缩小模型的期望与现实之间的差距,同时基础模型也在不断地改进。但仅仅使模型变得出色只是整个战斗的一半。生成式 AI 首次用户体验的剧本也在演变。

生成式 AI 市场图

生成式 AI 基础设施技术栈

完整报告:https://www.sequoiacap.com/article/generative-ai-act-two/

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。