一文多图搞懂 AI 核心概念:LLM、RAG、Agent、MCP 与 AGI
(笔者能力有限,如果发现问题希望在评论区指出,感谢!)
这段时间AI爆火,同时也出现了很多新名词。诸如RAG、Agent之类的一堆,但是大部分人看到这些都一头雾水,不知道具体是什么东西。下面就让我用一文+多图的方式让大家了解这些东西。
一、LLM —— 大语言模型
LLM(large language model,LLM)大语言模型是在2018年左右出现的一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用无监督学习对大量未标记语料进行预训练生成通用模型,然后再在不同特定任务下进行微调。
大模型按照输入数据类型的不同可以分为三大类:
•NLP:自然语言处理
•CV:计算机视觉大模型,一般用于图像分类、目标检测等
•多模态:可以处理多种不同类型的数据,是结合了NLP与CV
LLM大模型建立的流程主要是涉及下面这几个阶段:

LLM同时还有些缺点:
•LLM知识过时:训练数据有“截止日期”(比如GPT-4截止到2023年10月),无法回答2023年10月后的新信息(如2024年的新电影、新政策);
•易“胡编”:对不确定的知识,会“一本正经地瞎说”(行业叫“幻觉”),比如编造不存在的论文作者、错误的历史事件。
二、RAG(检索增强生成)—— 给LLM装“外挂知识库”
RAG:Retrieval Augmented Generation,是当前最火热的LLM应用方案,同时解决了上述的大模型知识过时和幻觉的问题。
RAG就是通过自由垂域数据库检索相关信息,合并成为提示模板。也就是会给单模型一个优质的Prompt

在实际落地时,为了提升RAG的检索精度和响应速度,可能会做下列优化:
•Chunk优化:对长文档递归分割,先分大Chunk,再分小Chunk,并添加父子Chunk关联
•选择微调后的专业Embedding模型
•优化检索算法
•多轮检索
RAG的典型应用
•企业客服:检索“产品手册”后回答用户的售后问题(比如“这款冰箱怎么调温度”);
•学术研究:检索“最新论文库”后总结某领域的研究进展;
•个人助理:检索“你的手机备忘录、日程表”后提醒你“今天下午3点有会议”。
声明:本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。邮箱:farmerlzj@163.com。 本站原创内容未经允许不得转载,或转载时需注明出处: 内容转载自: React前端网:https://qianduan.shop/blogs/detail/259。
想做或者在做副业的朋友欢迎加微信交流:farmerlzj,公众号:生财空间站。
#AI#LLM#RAG#Agent#MCP#AGI