跳转至

提示工程已死,AI工程万岁

最近,我一直在思考提示工程及其未来。还记得当初打造完美提示是获取AI最佳回应的秘诀吗?人们花费数小时调整措辞,试图让AI准确理解他们的需求。但事情正在发生变化,原因如下。

在Hacker News上的一次讨论让我深思。有人说,“提示不是一门科学。它们背后没有真正的方法。”你知道吗?他们可能是对的。随着最新的AI模型,如OpenAI的新“o1”模型,复杂提示的需求正在减少。这些模型变得更加智能,能够更好地处理简单、清晰的指令。

那么,现在真正重要的是什么?不再仅仅是提示,而是如何输入我们的思维和与AI互动。提示工程只是更大图景的一部分。关键是将你的思维方式和解决问题的方法融入你构建的系统中。这不仅仅是关于计算机系统。想想多代理系统甚至人类社会——这些也是系统。

OpenAI的新“o1”模型甚至建议了一些结构提示以提高性能的变化:

  1. 保持提示简洁明了:模型在简短清晰的指令下表现最佳。你不需要过多引导它们。
  2. 避免思维链提示:无需让模型“逐步思考”或解释其推理过程。它可以内部处理推理。
  3. 使用分隔符以增强清晰度:添加诸如三重引号或XML标签等可以帮助模型理解输入的不同部分。
  4. 在检索增强生成(RAG)中限制额外上下文:仅包含最相关的信息,以保持模型的回应集中。

这些建议表明,虽然提示工程并非毫无用处,但其角色正在发生变化。与其专注于打造详细的提示,我们应该专注于构建有效利用这些更智能AI模型的系统。

讨论中的另一个有趣观点是,OpenAI的“o1”模型和Anthropic的Claude现在都可以为你的任务生成最佳提示。这意味着AI本身可以帮助创建你所需的提示,使过程更加简便。

在现实世界中,构建AI应用展示了提示工程的重要性。如果你花费大量时间创建一个应用以实现实际目标,你会发现提示起着巨大的作用。要使提示正确需要大量繁琐、令人烦恼的工作。例如,在金融市场中,构建AI代理系统比完善每个提示更为简单。人们甚至构建系统来迭代提示,比如PromptLayer

使用AI代理和管理工作流程使AI应用变得更加复杂。这不仅仅是问一个问题并得到一个答案。它涉及创建一个能够处理不同任务、记住上下文并随着时间改进的整个系统。这一转变表明,AI工程——构建这些复杂系统——变得比以往任何时候都更加重要。

让我们从不同的角度来分析:

从AI研究员的视角:

AI模型已经发展到可以有效处理直接提示的程度。现在的重点是创建复杂的系统,如能够自主执行任务的AI代理。研究人员正在探索模型如何在无需详细提示的情况下使用自身的推理能力。能够记忆、处理上下文并自我改进的系统变得越来越重要。

从软件工程师的视角:

围绕AI模型的基础设施至关重要。构建与AI良好协作的系统不仅仅是提示的问题。这涉及创建可扩展的架构、管理数据流并确保一切顺利运行。良好的用户体验来自无缝的系统,而不仅仅是精心设计的提示。

从商业策略师的视角:

仅依赖提示工程不会带来持久的优势。构建反映公司解决问题方法的独特系统可以使你脱颖而出。投资于系统开发、创建知识产权和建立战略合作伙伴关系能带来真正的价值。理解市场需求并相应地定制系统比仅专注于提示更具影响力。

从认知科学家的视角:

人类思维是复杂的,涉及的不仅仅是简单的输入。AI系统应旨在模仿这种整体思维,而不是依赖脚本化的提示。研究人类如何解决问题可以帮助设计更直观和有效的AI系统。上下文感知和适应性等功能是构建智能系统的关键。

那么,为什么对简单任务过度详细化提示是没有必要的呢?首先,先进的模型具有内置的推理和处理上下文的机制。它们不需要详尽的指令来执行基本任务。简单的提示节省了时间,并减少了用户和AI之间的混淆。清晰直接的语言有助于避免误解。

然而,在需要特定格式或详细推理的复杂任务中,某种程度的提示工程可能仍然是必要的。当你需要创造性或细腻的回应时,额外的上下文可以提供帮助。但即便如此,这也只是构建更大、更有效系统的一部分。

总之,尽管提示工程并未完全消失,但其角色正在改变。焦点现在转向AI工程——构建能够理解和执行我们意图的强大系统,减少麻烦。关键在于将我们的思维和解决问题的过程融入AI的设计中。这带来了更强大、更有效的AI应用,无论是通过代理、网络还是其他系统模型。

对于简单任务,保持提示简洁明了就足够了。过于复杂的提示几乎没有好处。关键是理解AI的能力,并设计利用这些优势以实现你的目标的系统。

所以,让我们不再局限于打造完美的提示。相反,专注于构建充分利用AI能力的系统。毕竟,目标是解决问题和创造创新的解决方案,而不仅仅是与机器对话。

了解更多请访问 https://yunwei37.github.io/My-AI-experiment/ 或者 Github: https://github.com/yunwei37/My-AI-experiment

Share on Share on