智能体变现收入破百万的经验分享

这篇文章的内容分为六个部分
一.智能体基本概念
二.智能体核心组件
三.做一个简单智能体
四.智能体商单SOP
五.智能体商单案例
六.智能体的未来
 

一.智能体基本概念

1.什么是Agent?

Agent也称为代理,在人工智能领域,我们也称为智能体,AI Agent就是集成了AI能力的智能体。AI Agent的核心是利用大语言模型来完成任务。我们可以把智能体简单理解成一个自动完成任务的小助手,他就像数字员工一样,帮你完成指定的任务。
 
知名人工智能公司OpenAI对AI Agent的定义是以大语言模型(LLM)为大脑驱动,具有自主理解、感知、规划、记忆和使用工具的能力,能自动化执行复杂任务的智能体。它具有独立思考和行动能力,不仅能够处理信息,还能根据环境变化自主学习和适应,以实现特定的目标或解决特定的问题。
 
有个简单的公式可以表示智能体
AI Agent = LLM(大模型)+ Planning(规划)+ Memory(记忆) + Tools(工具)
如果把智能体类比成人,LLM(大模型)+ Planning(规划)+ Memory(记忆)可以类比成人类的大脑,而Tools则可以类比成人类的四肢。LLM(大模型)可以理解成人类大脑的核心, Planning(规划)理解成我们要做一件事情的流程,Memory(记忆)可以分为短期记忆和长期记忆,如果没有记忆能力,我们做任何事情每次都需要从头开始,Tools(工具)可以理解成借助工具做一些事情,比如我们要出门,可以步行也可以开车,可以更高效的实现目标。
 
这里也补充一个知识点,其实很早之前就有Agent的概念,但为什么最近才开始流行起来,因为只有集成了大模型的Agent才能真正的成为智能体,之前的Agent还是有点笨,只能处理简单的逻辑,因为大模型技术的发展,将Agent的能力提高到了前所未有的高度。
 

2.智能体可以做什么?

任何可以流程化、标准化的工作都可以通过智能体实现,智能体会影响我们工作生活的方方面面。比如一个运营人员,每天的工作是对标账号、分析数据、写文章、模仿爆款标题,我们就可以实现找对标账号、分析数据的智能体,写爆款文章、标题的智能体,有了这些智能体,只需要几个指令,就可以完成之前996的工作,妥妥的让AI来帮你打工!
现在已经有各种各样的智能体,比如写各种文案的智能体、帮助学习考试的智能体、各种办公提效的智能体、生活娱乐的智能体,扎克伯格之前在接受采访时就说过,未来的AI智能体可能比人类还多,人类将生活在一个有数亿、甚至数十亿AI智能体的世界中,人们能以不同的方式与之互动。
 
这里我截取了coze商店里的部分智能体,让大家有一个更加直观的感受。

3.智能体的构建原则

我们构建一个智能体,需要考虑清楚两个核心问题
(1)我们的需求是什么,我们希望这个智能体帮我们解决什么问题,需求都没考虑清楚就想做一个改变世界的应用,属于耍流氓。
(2)了解当下智能体的能力边界,目前智能体具备的能力是否可以解决你的问题。抛开时代背景去谈创新,很容易就成炮灰,我们加油仰望星空,也要脚踏实地,大家现在看到的黑科技也是基于当前社会的技术水平诞生的,而非空中楼阁。
 

4.智能体的门槛高不高

很多人一听智能体这个名字直接劝退,认为是不是必须懂编程才可以做智能体,其实这是一个严重的误区。
“将来,每个人都可以成为开发者,因为自然语言将成为通用的编程语言”,这话不是我说的,而且百度的老板李彦宏说的。
随着智能体平台能力的提升,智能体制作门槛会越来越低,甚至不久的将来,只要说句话,就可以制作一个专属的智能体,我相信AGI的时代已经会到来。
 

二.智能体的核心组件

大家还记得我上面提到过的那个智能体公式吗?
AI Agent(智能体) = LLM(大模型)+ Planning(规划)+ Memory(记忆) + Tools(工具)
 
这个公式还是有一些抽象,让人摸不着头脑,落实到具体的实现一个智能体的组成部分,我们可以做如下的映射
LLM(大模型):对应智能体的大模型节点
Planning(规划):对应智能体的工作流
Memory(记忆):对应智能体的知识库、数据库、变量
Tools(工具):对应智能体的插件
 
接下来,我们一点点介绍上面提到的大模型节点、工作流、知识库、插件,当你学会这些智能体的组件,然后再有一点产品思维,基本就可以比较轻松构建出一个可以切实解决某个现实痛点问题的智能体应用。
 

1.大模型节点

其实就是引入目前市面上成熟的大模型组件,借助大模型庞大的知识储备、推理能力,我们可以将用户非结构化的提问转成结构化的数据,作为输入投喂给对应的工作流做初始参数。
举个例子,比如用户通过语音告诉智能体,他要定8.1号从北京到上海的火车票。没有大模型之前,其实处理起来还是很复杂的,因为客户的提问千差万别,所以我们的应用必须要具备自然语言的识别能力,仅仅靠无限穷举的方式是很难把所有的情况都考虑到的。我们可以借助大模型的推理能力,将用户的提问,提取出出发日期、起始地点、终止地点、乘坐的交通工具等,然后可以调用一个订火车票的插件来实现车票的查询,如果之前有存储用户的基本信息,我们也可以直接帮助客户下单订票。
 

2.工作流

工作流就是做一件事情的流程。大家可以理解成完成预设目标的一个任务集合。
一个比较经典的问题:把大象放冰箱分几步?这其实就是一个工作流,第一步,把冰箱门打开,第二步,把大象放进去,第三步,把冰箱门关上。哈哈哈,工作流是不是也没你想的那么难。
不过很多事情并不是线性的,甚至是有各种嵌套关系,针对复杂的工作流,我们要有大局观,从整体入手,先把任务拆解成子任务,然后针对子任务再进一步拆分,这种思想也称为分而治之,在处理复杂系统时特别有效,因为他允许问题被逐步解决,而不是一次性处理,从而降低了解决问题的难度和复杂性。
 
为了让大家有更直观的感受,这里我给大家演示一个Coze(一个智能体创建平台)上可调用大模型对用户问题进行答疑的工作流
整个大模型问答工作流就三个节点
开始节点:接受用户的问题,比如“给我一些学习AI的建议”
大模型节点:将用户的问题传入大模型进行处理
结束节点:将大模型推理后的内容返回给用户。
大家可以看一下效果:
是不是超级简单,这里其实我们可以创建各种帮助我们解决实际问题的工作流,比如生成公众号的标题的工作流、做绘本的工作流、辅导孩子写作业的工作流等等,而且工作流之间可以相互嵌套、链接,从而实现更复杂的能力。
解决工作流问题,是AI智能体应用落地的关键。工作流,决定了产品流程能否跑通,产品化能否实现。
 

3.Memory(知识、记忆)

以下为普通用户免费学习的内容,微信授权登录即可免费低调学习:

© 版权声明
THE END
喜欢就支持一下吧
点赞40 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容