做个英文网站多少钱江苏企业网站建设价格-宁德市网站建设公司-Seo优化

做个英文网站多少钱,江苏企业网站建设价格,岗顶网站开发,应用公园app在线平台新兴技术的出现#xff0c;总会伴随着术语洪流和流派之争#xff0c;带来认知摩擦。近期 OpenAI 发布了《A Practical Guide to Building Agents》电子书[1]#xff0c;随后 Langchain 负责人驳斥了电子书中的一些观点#xff0c;在官方博客发布了《How to think about a…新兴技术的出现总会伴随着术语洪流和流派之争带来认知摩擦。近期 OpenAI 发布了《A Practical Guide to Building Agents》电子书[1]随后 Langchain 负责人驳斥了电子书中的一些观点在官方博客发布了《How to think about agent frameworks》[2]。在一次夜聊中受到同事亦盏的启发新兴技术领域往往会经历事实标准的争夺是模型往上还是编排框架向下时间才能给出答案但作为行业从业者不妨从中举一反三甄别对自己有价值的信息。本文通过提取并梳理以上两篇文章中的技术术语和价值信息并进行扩展再以问答形式来呈现希望通过这种方式在加深使用者和开发者对 AI Agent 的了解方面起到一些帮助。一、什么是 AI AgentAgent中文翻译为代理顾名思义代替用户在代理权限内去处理相关事宜。例如我聘请你作为代理律师那么你将以我的名义进行民事法律行为再例如我今天休假了设置同事作为我的代理去处理审批流等任务。而 AI Agent 是指在普通代理的基础上具备对任务的理解、环境的感知、信息的获取能力并通过推理能力自主进行决策和执行。AI Agent 就是 LLM 客户端Chatbot、AI IDE 等组成的产品代替我们去自主的完成下达的任务这里的客户端具备规划、工具使用甚至记忆的功能目的都是为了更准确的执行任务。二、AI Agent 与传统软件、传统自动化软件有何区别传统软件往往依赖用户的明确指令和操作要求并按照后端系统预设的规则和流程运行用户须深度参与其中。而 AI Agent 借助 LLM 的感知、理解和推理能力依据任务要求提取外部知识库RAG、联网搜索、借助各种工具和网页、其他软件等进行交互从而完成代理目标。例如在客服场景Agent 能像经验丰富的客服人员一样准确理解客户的问题迅速从专有知识库中检索相关信息组织语言给出恰当且专业的回复从而独立处理客户咨询、投诉等各类问题。例如在办公场景中只需告知报告的主题和详细要求Agent 便能自主收集资料提取有效信息梳理文章结构根据用户偏好或行业规范例如正式、技术范儿、诙谐、科普等完成报告的撰写并绘制表图进行排版。传统自动化软件虽然也具备依据任务要求自动对任务进行拆解并完成目标。例如一些自动化的处理程序像每天定点发送代金券定点汇总当日的账单。但 LLM 驱动的 Agent 可以处理那些传统自动化方法难以应对的复杂任务。例如需要决策根据代码上下文灵活理解意图、自主定位错误、自主规划修复步骤如代码场景。传统自动化软件只能按规则跑流程遇到异常或不确定性时无法自主推理和修正。需要连续推理与多步计划自动完成有逻辑连贯性的复杂任务例如撰写长篇技术报告场景。传统自动化软件最多能模板化填充内容无法根据目标动态规划章节结构、铺设推理链条、前后自洽。需要跨系统自主整合数据在多个ERP、CRM、财务系统之间自动生成综合运营报告。传统 RPA机器人流程自动化只能定向拉取数据无法理解数据之间的隐含关联或异常。需要处理模糊、不完整输入用户只给出一句含糊需求如“帮我优化一下销售流程”系统理解后完成多步落地执行传统自动化软件需要结构化清晰指令无法理解模糊自然语言并自主澄清、细化、规划。需要自主学习和演化持续优化任务进行自我纠错。传统自动化工具需要人为设定优化规则无法根据实际结果自我改进。简单来讲AI Agent 是自动化智能这就解释了 AI Agent 出现前已经通过自动化能做的事AI Agent 能带来哪些变化。三、Chatbot 为何都在向 AI Agent 演进这个过程中发生了什么早期OpenAI 等基模公司提供的都是能说会道的 Chatbot但几乎大家都开始往真知实干的 AI Agent 演进。两者的区别我们先来汇总一张基础表格。从答疑到连接物理世界LLM Chatbot 本质是概率驱动的文本生成器通过海量语料的训练掌握语言模式就像一位博闻强记的图书管理员能复述书中的知识却因为缺乏对真实世界的理解和调度能力难以自主决策和行动。此后OpenAI 发布了 Function Call 和 Operator是技术上向 AI Agent 的探索而 Devin 和 Manus 则是第一次把 AI Agent 以产品的形态呈现给公众让大家感受到 AI Agent 到底长什么样能做些什么。OpenAI Pro已经提供深度研究的扩展能力。QWen 即将推出 MCP 插件。国产 Chatbot 开源客户端四小龙Cherry Studio、DeepChat、LobeChat 等也都正在开发对 MCP 的支持。Higress 提供了 MCP 市场支持客户端快速提供 MCP 能力https://mcp.higress.ai/抽象来讲能力边界是 Chatbot 与 AI Agent 的本质差异。Chatbot 向 AI Agent 演进是技术驱动和市场需求的必然。技术驱动因素LLM 能力本身提升了部分大语言模型已经可以做复杂推理、链式思考Chain of Thought不仅能回答还能自己拆解问题。单纯的对话已经无法充分利用大模型的推理和行动潜力。多工具协作Tool Use的成熟Agent 可以调用插件、API、浏览器、代码解释器等外部工具不再只是单一语言生成。Chatbot 如果只靠纯语言很难完成复杂任务比如订一张机票需要多步操作。长期记忆和自主性能力发展记忆机制让 Agent 能记住用户习惯、历史任务自动优化策略。自主性支持 Agent 根据反馈调整自身行为不需要用户的每一步指令。**规划和推理模块的成熟**早期 LLM 只能“回答”而现在已经可以“先思考计划”再执行更像人类的助理。市场/需求驱动因素**用户对效率和自动化的要求更高**企业、个人用户都希望AI可以代替人去做琐碎、复杂的连续任务而不是每次提问每次回答。**商业模式扩展需求**仅靠 Chatbot 很难延续收费模式而基于 Agent 的服务能拓展出 SaaS、B2B 集成、专属 Agent 市场。**竞争环境变化**几乎所有的一线基模厂商都在发展 AI Agent以及还有 Manus、AI 编程都在做 AI Agent预计今年 Q3 会出现很多垂直领域的 AI Agent。四、AI Agent 由哪些组件构成AI Agent 的构成尚无统一的标准。Anthropic 认为是大模型基于环境反馈去使用工具的一套程序并区分了 WorkflowLLM 和工具通过预定义代码路径编排和 AgentLLM 动态控制流程和工具使用且多数生产中的 “智能体系统” 是两者的结合。因此他有以下三个核心要素**模型Model**Agent 的“大脑”是基座、是引擎。环境反馈Context定义了模型执行任务时要用到的信息的总和包括通过 Tool 拿到的信息、用户输入的信息等等。**工具Tool**Agent 的“手脚”通过所依赖的外部函数或 API应用程序接口与外部系统进行交互获取信息并执行操作。技术实现方式有 OpenAI 的 Function Calling、Computer Use以及 Antronic 发起的 MCP 通信协议。Google 发起的 A2A则是 Agent 和 Agent 之间交互的通信协议。OpenAI 则是定义为模型、工具和指令弱化了环境反馈Context将其下沉到模型层使命是让 Agent 产品化例如 OpenAI 最新发布的 o3 已经内置了很多 tools 的能力。指令Instruction是指Agent 的行为准则有了指令就能唤醒 Agent。高质量的指令技巧能够减少歧义提高智能代理的执行效果而高质量的提示词工程能够提升 Agent 对指令的理解准确度。前者是面向结果后者是面向过程。如果您对 Instruction 理解依旧不清晰请参考下方的代码样例。和 Anthropic 定义的区别是OpenAI 对外部应用程序的调用和调用效果的优化即 if/else 的判断下沉到了模型层由模型来内化而非编排层来实现。OpenAI 越来越往上模型定义一切Anthropic 越来越往外生态成就一切。五、AI Agent 的工作原理AI Agent 的工作原理可以从感知、认知推理决策、行动、反馈和学习4个关键过程来解释。[3]感知阶段这是唤醒 AI Agent 的第一步感知内容分为。来自物理世界的信息包括来自客户端的任务自然语言、代码、多模态等以及通过传感器、摄像头、麦克风硬件设备的传感信息。来自虚拟环境的信息从数据库、外部 API 接口等收集到的信息。认知推理决策阶段一旦 AI Agent 感知到环境信息依赖深度学习、强化学习带来的训练结果对这些信息进行识别与分析以便作出明智的决策。这个过程中会借助 RAG、联网搜索、外部应用和系统调用。这一阶段是 AI Agent 行为的核心直接决定了后续行动的有效性。但由于深度学习、强化学习的模型依旧缺乏完全的可解释性是输出结果不确定性的主要原因之一。对于复杂任务决策并不是一个结果而是需要经历和环境感知、认知和推理之间反复交互的过程。因此还会受到提示词工程的影响例如我们在《Promt Engineering》分享的输出长度、top-K 和 top-P 、Temprature 等参数都会影响到最终的决策结果。行动阶段最终AI Agent 根据其决策采取行动。这一阶段的目标是执行之前所做的决策并进行输出例如一个模型、一份计划书、甚至是一个物理界的执行动作如自动驾驶中的车辆控制、机器人执行任务、下单等。反馈与学习AI Agent 的能力不仅仅停留在执行阶段它还会不断地根据执行结果进行反馈并在每次任务后学习例如 Monica 提供了记忆功能通过学习AI Agent 能够逐渐优化自身的决策过程和行动策略。这一过程通常使用强化学习或其他在线学习技术来实现。六、如何提升 AI Agent 的输出效果从 LangChain 的调研来看41% 的受访者认为性能质量是构建可靠智能体系统的最大限制。性能质量表现不佳常因模型不够好或传递了错误或不完整的上下文后者更加常见包括不完整或简短的系统消息、模糊的用户输入、无法访问正确的工具、工具描述不佳、未传递正确的上下文、工具响应格式不佳等。因此提升 AI Agent 的输出效果关键也在于模型质量和环境反馈Context我们将环境反馈拆解成工具和指令来展开描述。模型类型和质量不同模型在任务复杂性、性能和成本方面具有不同的优势和权衡。即便是同一个厂商也会区分推理类模型、复杂任务类模型、多模态模型。我们应根据任务类型选择更适合的模型。下图是 Qwen 官网对主流模型的比对表。不同厂商相同类型的模型输出效果也不一样并且是动态变化的。就好像你的学生每次拿第一的不会永远是同一个人不同科目的也会有不同的排名。人类竞技有单场胜负更有 N 连冠。但是人工智能遍布生活中的每一个场景不是单次结果论英雄的竞技场。因此在供应链视角企业通常会采用多模型策略通过 AI 网关在后端对接多个模型一是为了提供更加丰富且对口的输出结果供用户使用二是满足鉴权、安全防护、限流、可观测、审计等方面的企业级需求。工具工具是指 AI Agent 使用外部应用程序或系统的 API 来扩展代理边界的功能。例如 LLM Chatbot 在处理复杂的科学和数学问题时“幻觉”会被放大。此时AI Agent 集成 Wolfram Alpha 的 Server能够准确地执行计算任务避免因模型自身的局限性而导致的错误。与大语言模型相比Wolfram Alpha 基于广泛的数学和科学知识库在处理复杂的数学公式、物理定律和科学概念时能够进行精确的计算、符号操作和公式推导。目前主流的技术实现方式是 MCP 和 Function CallFunction Call 是最早提出的MCP 是在此基础之上做了协议的标准化。另外OpenAI 今年1月推出 Operator 的形式截屏以视觉方式读取浏览器的页面信息来和外部页面进行交互通过视觉算法模拟用户操作来访问网页信息。优势是 token 消耗少即便没有 API 接口也可以进行交互且更容易适应不同的网站设计和布局变化。但由于客户端实现成本高视觉算法导致的出错率不可控服务端没有参与感等原因并未像 MCP 那样形成广泛共识。这算是两个技术流派MCP 和 Function Call 是工程派Operator 是算法派。对大部分用户而言并不会太关注工具背后的技术实现方式更关注的是工具的添加别给原本就容易产生幻觉的大模型新增烦恼。其次是信任感例如 DeepSeek 首次将深度思考的过程呈现给用户时这对 Chatbot 的体验而言获得了大幅提升随后各家都相继推出深度思考的功能。AI Agent 也是类似。MCP 和 Function Call 在用户端呈现的是Agent 调用 MCP tool 的过程是代码语言而 Operator 呈现的是用户语言例如在 Manus 里会展示他在页面浏览器的操作过程。后者因为更透明给用户带来更多的信任感。[4]另外从供应端来看工具虽然拓展了 AI Agent 的想象空间但也带了一些难题信息对齐难LLM 读取 MCP Server 的信息时就像让两个哲学家用摩斯密码聊黑格尔调试得当神配合搞错了那就是哲学灾难。因此构建 MCP Server少不了和大模型联调的过程。协议开销大相比 ChatbotAI Agent 的上下文记忆链条、任务步骤更多实时任务秒变“慢动作回放”单个任务可能耗时半小时。这也催生了 MCP as a Service例如 MCP Marketplace帮你找到干净好用、无须调优的 Server通过网关的权限和标签能力来控制工具的使用范围当工具数量的增加使用 MCP Registry 来解决工具在批量生效、调试、历史版本管理灰度、健康检查的需求。以及 AutoMCP让模型通过反复试验来学习工具的使用方法而不只是通过提示工程来优化工具的调用效果。指令指令分为两类一类是终端用户提问时的提示词技巧一类是开发者侧训练大模型用的提示词工程。但无论是哪一种以下4个可以看作是改善输出结果的原则。利用现有文档将现有的操作流程或政策文件转换为智能代理可以理解的指令。终端用户上传报告、图片让大模型提取其中内容进行二次加工。开发者只要是涉及医疗领域的任务一律自动追加‘答案仅供参考请咨询专业医生”。分解任务将复杂的任务分解为更小、更清晰的步骤减少歧义。终端用户根据提示词让大模型输出一篇报告改为按章节、段落来输出。开发者将分解用户的任务进分解成计算机语言可以描述和执行的步骤并针对多选答案和用户完成核实后再执行下一步。定义明确的行动确保每个步骤都有具体的行动或输出避免模糊不清的指令。终端用户将自己的任务尽可能拆解成计算机能理解的描述而非即便自然语言也会出现理解偏差的任务或指令。开发者通过自然语言理解NLU将指令拆解成可以精确计算的步骤。考虑边缘情况提前规划如何处理用户提供的不完整信息或意外问题。出现问题时能自主纠错在遇到故障时还可暂停执行并将控制权交回用户。作为用户如果编写指令有困难可以将你觉得满意的任务结果例如一篇论文、一张图片喂给模型由他来生成指令这是设计指令的有效技巧。同时指令要常用内化成习惯才能更高效的使用 Agent这就像大部分企业管理者每天早上到公司都会先打开数据系统了解过去1天的业务数据这时候“打开数据系统”就是一则对人脑的指令。指令也正在内化为大模型的能力通过对话引导的方式来帮助用户将自己的任务描述的更加清楚因为很多情况下我们对大模型的输出效果不满意不是其不够智能而是我们没有将任务描述、分解的足够明确。来看一个例子。当我提问AI 网关在 Agent 构建过程中起到了哪些作用显然这个任务描述的不够明确。于是大模型给出了描述更加明确的方式如下。七、如何定义 Workflow、Agent、Agentic 的联系和区别从第7问开始之所以会转到 Workflow是因为当下讨论较多的“ Workflow 是否会被 LLM 颠覆”这个问题是一个典型的 LLM 侵蚀工程化、产品化的案例很多人在工程、产品上做了大量的原创设计和调优工作某一天却被 LLM 直接接管了。而 Workflow 更加特别由于他的功能和定位影响到的群体更大。Workflow即工作流常见于应用编排框架中是将任务依据特定业务逻辑有序排列的流程以实现业务流程自动化处理。任务之间有清晰的依赖关系和流转规则每个任务都有明确的输入、输出和执行逻辑。定义他的是人优点是确定性足够强不太会出错短板是不够泛化。而 LLM 是足够泛化但确定性不够。从语义上看Agent 是一个名词 Agentic 是一个形容词前者是以二元的方式来判断某个东西是否是智能体后者则是更倾向于讨论一个系统的智能体程度。讨论 Agent 的时候很容易进入将是否使用了 Workflow 来判断这是否一个 AI Agent尤其是在 Workflow 中了定义了大量的 if/else 逻辑减弱了大语言模型控制力的时候。讨论 Agentic 的时候关注的是判断流程是否进入下一步、判断流程是否最终完成、判断是否出现问题、判断出现问题后是否把控制权限交给用户等流程节点时是由 Workflow 来控制还是有 LLM 来控制。LLM 控制越多智能程度越高反之越低。现阶段很多 AI Agent 都存在 Workflow 和 LLM 结合的情况。结合的方式包括LLM赋能Workflow在工作流的各个任务环节中嵌入大模型能力。例如在内容创作工作流里在素材收集阶段大模型可对海量的文本、图像等素材进行智能筛选和分类快速定位符合需求的资源在创作环节利用大模型生成初步内容框架或文案像新媒体文章创作大模型能依据主题生成文章大纲和部分段落内容创作者在此基础上优化完善提升创作效率。Workflow驱动LLM****交互以工作流的流程逻辑来引导大模型的交互过程。比如在智能客服工作流中当用户咨询问题时工作流先对问题进行初步分类然后根据分类结果调用大模型进行针对性回答。若问题涉及产品使用方法工作流将问题精准传递给已在产品知识上微调的大模型获取准确答案后返回给用户确保回答的专业性和高效性。八、Workflow 和 LLM 如何选择首先澄清下这个标题并不是引导二选一。如第7个 QA 所说大多数实际生产中AI Agent 的任务处理逻辑设计是 Workflow 和 LLM 的组合。之所以业内有这样的争论也许是因为 LLM 派信仰的是智能本身可以通过指令来提升智能的确定性参考第6个 QA 中的对话案例Workflow 派信仰的是智能无法覆盖所有场景必然有场景需要通过 Workflow 来精确决定数据的流动方式。《How to think about agent frameworks》给出了一个采用 Workflow 和 LLM 的权衡方式。图中使用的是 workflow vs. agents为区别 AI Agent本文改为 workflow vs. LLM 来描述低门槛低门槛框架对初学者友好容易上手。但自由度会下降尤其是要去满足复杂的业务需求的情况下。高门槛高门槛框架意味着学习曲线陡峭需要具备大量知识或专业技能才能有效使用但更适用于解决复杂的业务场景。低上限低上限框架指的是其在所能完成的任务上存在限制。高上限高上限框架为高级用例提供广泛的功能和灵活性。Workflow上限高门槛高你必须自己编写大量的智能体逻辑。LLM门槛低上限也低容易上手但对于复杂用例来说不够用。以上来自 Langchain 的观点信仰 LLM 的人一定不认可“ LLM 是门槛低上限也低容易上手但对于复杂用例来说不够用”的论断随着 LLM 更加智能并通过对话的方式帮助用户来完善指令并借助画布等产品交互方式降低指令的优化难度。完善的内容包括任务的描述完整度和准确度任务的拆解每一步骤和用户进行确认从而减少甚至避免单个步骤90%准确率10个步骤准确率陡降为90%的10次方的情况。以这种方式来提升 LLM 在复杂用例的表现。本质上这是两种技术/产品流派的碰撞。九、什么是 Single-Agent System和 Multi-Agent SystemSingle - Agent System单智能体系统指在一个系统中仅存在单个智能体该智能体独立完成任务其决策和行动仅基于自身的感知、知识与能力不与其他智能体协作或交互。Multi - Agent System多智能体系统由多个智能体组成这些智能体相互协作、交互共同完成复杂任务。各智能体具有自主性可独立做出决策但通过信息共享、协作等方式实现共同目标。预计今年 Q3 会上线很多垂直领域的单智能体系统例如专注于做表格的专注于做报告的专注于做旅行计划的并逐步呈现互联网 APP 的繁荣景象。这些垂直领域的单智能体系统将成为未来多智能体系统的协作基础。对于多智能体系统理论上可以为经理模式和去中心化模式。经理模式下存在一个中心 “经理” 代理它以调用工具的方式协调多个专业代理。“经理” 代理负责将任务分配给合适的专业代理并整合最终结果提供统一的用户体验适用于希望由一个代理掌控工作流程并与用户交互的场景。去中心化模式中多个代理地位平等可相互移交任务执行权。当一个代理调用移交函数新代理立即开始执行并接收最新对话状态。十、为什么需要多智能体系统抛开技术因素会有两个截然不同的观点。正方模型越强大所有 AI Agent 都有可能被“模型即产品”所替代不需要多智能体系统。反方模型再智能也无法主动甄别所有环境感知Context每个细分领域的 Agent调研类 Agent、Coding Agent、表格 Agent都需要花大量的时间少则半年多则一年去设计环境感知Context减少模型幻觉Agent 会像互联网 APP 那样百家齐放而不是一家独大。这个需要时间来证明。单只从技术视角看多智能体系统是必要的。读者福利如果大家对大模型感兴趣这套大模型学习资料一定对你有用对于0基础小白入门如果你是零基础小白想快速入门大模型是可以考虑的。一方面是学习时间相对较短学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。作为一名老互联网人看着AI越来越火也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。包括入门指南、学习路径图、精选书籍、视频课还有我录的一些实战讲解。全部免费不搞虚的。学习从来都是自己的事我能做的就是帮你把路铺平一点。资料都放在下面了有需要的直接拿能用到多少就看你自己了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以点击文章最下方的VX名片免费领取【保真100%】

做个英文网站多少钱江苏企业网站建设价格

做软件需要网站怎样建立网站快捷方式

宝山品牌网站建设威海建设信息网站

网站建设飠金手指排名十二建设银行软件官方网站

网站定制设计做图文网站要什么配置的服务器

百度竞价推广怎么样东莞关键词优化实力乐云seo

电子商务网站建设与管理项目任务教材北京手机网站设计公司

做个英文网站多少钱江苏企业网站建设价格

做软件需要网站怎样建立网站快捷方式

宝山品牌网站建设威海建设信息网站

网站建设飠金手指排名十二建设银行软件官方网站

网站定制设计做图文网站要什么配置的服务器

百度竞价推广怎么样东莞关键词优化实力乐云seo

电子商务网站建设与管理 项目任务 教材北京手机网站设计公司

电子商务网站建设与管理项目任务教材北京手机网站设计公司