AI-NEWS · 2024年 11月 27日

你需要的是友好AI的工作流

分析报告:AI代理在应用中的作用与设计原则

概述

AI代理的概念正逐渐流行,有些人认为它们是解决AI问题的“万能药”。然而,也有人认为AI代理被过度炒作,并没有实际可行的应用。Andrew Ng曾用多代理翻译来提高质量,即使用直接翻译、审查和改写三个代理来提升翻译品质。不过,这并不是因为使用了多个代理,而是利用了一种名为“思维链”(Chain of Thought, CoT)的方法,这种方法通过将复杂推理分解为步骤来提升输出质量。

如何设计AI友好的工作流

关键点

  1. 避免让AI解决方案局限于人类方法。例如,在翻译任务中,人类译者可以一次性完成高质量的翻译而不需明确遵循直接翻译、反思和改写等步骤。然而,使用CoT能更好地适应AI的工作方式。

  2. 不要完全依赖AI来做决定——AI应辅助人做决策。项目如AutoGPT试图让AI处理复杂的开放任务,但当前技术尚未成熟,导致执行效果不佳且成本高昂。

  3. 跨领域结合多种AI模型和工具以获得更好的解决方案。大型语言模型(LLMs)易于使用,但不应忽视与其他特定领域的AI工具的集成。

  4. 回归根本问题——AI只是一个工具。应将AI视为解决问题的一部分而非目标本身,并基于“第一原理”的方法设计工作流,即明确核心问题、分解问题并从基础构建解决方案。

两个优化的工作流程案例

  1. PDF转Markdown

    • 使用GPT-4和PyMuPDF来提取内容。
    • PyMuPDF检测图像、图形和表格,并将其转换为独立的图像。
    • GPT-4解释标记图生成相应的Markdown格式文本。
  2. 漫画翻译

    • 专用于识别对话框的位置模型。
    • 使用OCR从这些气泡中提取文本。
    • 删除原文字并使用GPT-4进行基于视觉内容的翻译。
    • 将翻译后的文本重新插入原始位置。

结论

为了充分利用AI,关键在于设计适应其优势的工作流。重点应放在有效解决核心问题上,将AI作为工具而非终极目标。

Source:https://baoyu.io/blog/ai-agent/what-you-need-is-ai-friendly-workflow