ai-agent工程师指南

作者:哈里谢顿日期:2026/3/7

一些基本概念

1 Zero-shot & Few-shot 是什么?

1. Zero-shot(零样本)

不给例子,直接让模型做。

  • 不提供任何参考样例
  • 只告诉模型任务是什么
  • 完全靠模型本身能力去理解、推理

例子

把下面句子分类成积极 / 消极:这部电影太好看了!

这就是 zero-shot


2. Few-shot(少样本 / 小样本)

给几个例子,再让模型做。

  • 1~10 个左右的示例
  • 告诉模型:我要你像这样输出
  • 模型照着格式、逻辑去做

例子

分类:今天心情很好 → 积极分类:这部电影好无聊 → 消极分类:这家店味道超赞 →?

这就是 few-shot


一句话总结

  • Zero-shot:不给例子,直接干。
  • Few-shot:给几个例子,照着干。

2 RAG 是什么?

RAG = Retrieval-Augmented Generation****检索增强生成

一句话:先从外部资料里查相关内容 → 再把查到的内容喂给大模型 → 让模型基于真实资料回答。

3 Embedding 模型 是什么?

一句话:把文字、图片、声音等信息,变成一串数字(向量),让计算机能 “看懂、比较、计算”。


1. 核心作用

人理解文字靠语义,计算机只认数字。Embedding 模型做的就是:把 “语义” → 变成 “向量”

比如:

  • “苹果” → [0.1, 0.5, -0.2, …]
  • “香蕉” → [0.12, 0.48, -0.19, …]
  • “汽车” → [ -0.8, 0.1, 0.3, …]

语义越接近,向量越接近。


2. 它能干什么?(最常见用途)

  1. 搜索搜 “好吃的水果”,能找到苹果、香蕉,而不是汽车。
  2. 推荐你看了 A 文章,给你推语义相似的 B 文章。
  3. 知识库问答 / RAG把文档变成 embedding,用户提问也转成 embedding,找最相似的段落
  4. 分类、聚类自动把相似内容归为一类。

3. 和普通大模型有什么区别?

  • 大模型(如 GPT、Llama) :生成文字、回答问题。
  • Embedding 模型不生成文字,只做 “语义编码”

4. 简单例子(你马上能懂)

你问:“什么是猫?”

  1. 问题 → 转成 embedding 向量
  2. 库里所有文档 → 都提前转成 embedding
  3. 计算机算距离,找到最接近的文档
  4. 把那段文字丢给大模型回答

这就是现在最火的 RAG(检索增强生成) 的核心。


5. 常用的 Embedding 模型

  • OpenAI:text-embedding-ada-002text-embedding-3
  • 开源:BGEm3etext2vec(中文很强)
  • 特点:小、快、省显存,低配电脑也能跑。

超简总结

Embedding 模型 = 语义翻译官把人类语言 → 翻译成计算机能理解的数字向量,用来做:搜索、推荐、知识库、相似度匹配。


ai-agent工程师指南》 是转载文章,点击查看原文


相关推荐


CSDN创作变现活动!社区镜像或使用视频教程分别单个最高得 80 元,收益上不封顶!
CSDN官方博客2026/2/27

CSDN AI 社区是聚焦 AI 技术产业落地的开发者服务平台(官方入口),核心为创作者搭建技术价值转化桥梁,AI社区涵盖: 镜像市场(社区镜像)、算力市场等模块。 本次推出镜像创作激励活动,以下是方案活动规则、参与要求及激励政策,保障创作者权益与活动有序开展。 一、活动总则 活动时间: 2026年1月1日 - 2026年2月28日 现金奖励: 1、按照官方指定镜像任务创作,单个社区镜像奖励 30-80元现金 ,创作越多可获得现金奖


深度解析 JWT:从 RFC 原理到 NestJS 实战与架构权衡
NEXT062026/2/18

1. 引言 HTTP 协议本质上是无状态(Stateless)的。在早期的单体应用时代,为了识别用户身份,我们通常依赖 Session-Cookie 机制:服务端在内存或数据库中存储 Session 数据,客户端浏览器通过 Cookie 携带 Session ID。 然而,随着微服务架构和分布式系统的兴起,这种有状态(Stateful)的机制暴露出了明显的弊端:Session 数据需要在集群节点间同步(Session Sticky 或 Session Replication),这极大地限制了系统


RTOS核心三剑客:任务、信号量与队列深度解析
牛逍遥2026/2/9

RTOS核心三剑客:任务、信号量与队列深度解析 一、裸机编程的瓶颈:为什么需要RTOS? 在嵌入式开发中,裸机程序通常采用**超级循环(Super Loop)**结构: void main() { while(1) { read_sensors();// 读取传感器 process_data();// 处理数据 update_display();// 刷新显示 handle_uart();// 串口通信 check_safety();// 安全检测 } } 裸机编程的致命缺陷: 阻塞操作导致响


Objective-C手机验证码短信接口调用流程:创建请求对象并设置报文体
2601_949146532026/2/1

在iOS原生开发中,基于Objective-C对接手机验证码短信接口是账号安全、用户验证场景的核心需求,但新手常因请求对象创建不规范、报文体参数编码错误、请求头配置缺失等问题,导致接口返回405(API ID错误)、407(内容含敏感字符)等异常。本文聚焦objective-c手机验证码短信接口的核心调用流程,拆解创建NSURLRequest请求对象、配置请求头、设置报文体的完整逻辑,提供可直接复用的实战代码,解决参数编码、状态码解析等痛点,帮助开发者高效完成接口对接。 一、Objective


没显卡也能玩!Ollama 本地大模型保姆级入门指南
字节逆旅2026/1/22

如果你想在自己电脑上跑 AI,又不希望数据被大厂拿走,Ollama 绝对是目前最香的选择。不用配复杂的 Python 环境,不用求爷爷告奶奶找 API Key,只要一键安装,就能实现“大模型自由”。不过我的电脑很早就有了python环境了,忘记啥时候安装的,虽然在python方面还是个菜鸟。 1. 怎么安装 直接去 Ollama 官网 下载。有1个多G,先有个心理准备。 第一步: 安装完后,它会躲在右下角任务栏。 第二步: 打开终端(CMD 或 PowerShell),输入下面的命令。这


一个致力于为 C# 程序员提供更佳的编码体验和效率的 Visual Studio 扩展插件
追逐时光者2026/1/14

前言 今天大姚给大家分享一个致力于为 C# 程序员提供更佳的编码体验和效率的 Visual Studio 扩展插件:Codist。 Codist 插件介绍 Codist 是一个使用 .NET 编写、开源免费的 Visual Studio 扩展插件,致力于为 C# 程序员提供更好的编程体验和生产效率。它不仅强化了语法高亮、快速信息提示、导航栏、滚动条和显示质量,还集成了自动版本号更新、括号自动补全、支持高级编辑功能的智能工具栏、代码分析等功能。 支持 Visual Studio 版本 Visu


2026:一名码农的“不靠谱”年度规划
苏渡苇2026/1/6

又到了一年一度列计划的时候,我对着屏幕敲下“2026年度目标”这几个字,感觉就像在代码里写下了一个暂时没有具体实现的接口——定义很美好,实现嘛,有待观察。 一、工作要干得出彩,还得有点新花样 说真的,每年我都告诉自己,今年一定要写出那种能让同事看了忍不住赞叹“妙啊”的代码。但实际情况往往是,我对着三年前自己写的代码陷入沉思:“这真是我写的吗?当时怎么想的?” 新点子倒是不缺,缺的是能让这些点子安全落地还不引起生产事故的魔法。我现在的原则是:每个炫酷的想法,都必须配套一个“搞砸了怎么办”的预案。


基于 YOLOv8 的驾驶员疲劳状态识别系统实战(含完整源码与可视化界面)
我是杰尼2025/12/28

基于 YOLOv8 的驾驶员疲劳状态识别系统实战(含完整源码与可视化界面) 一、项目背景与研究意义 随着汽车保有量的持续增长,疲劳驾驶已成为交通事故的重要诱因之一。据统计,在高速公路和长途驾驶场景中,由于驾驶员长时间保持同一姿态,容易出现注意力下降、反应迟钝、频繁眨眼、打哈欠等疲劳特征,从而显著提升事故风险。 传统的疲劳检测方法多依赖以下方式: 车载方向盘行为分析 心率、脑电等生理传感器 人工巡查与事后分析 这些方法或成本较高,或依赖额外硬件,或难以规模化部署。相比之下,基于计算机视觉的疲劳


基于大衍数构造的稀疏校验矩阵LDPC误码率matlab仿真,对比不同译码迭代次数,码率以及码长
我爱C编程2025/12/19

目录 1.引言 2.算法测试效果 3.算法涉及理论知识概要 4.MATLAB核心程序 5.完整算法代码文件获得 1.引言        基于大衍数的LDPC校验矩阵构造,本质是利用大衍数序列的周期性和互素性,设计具有规则稀疏结构的校验矩阵,兼顾性能与实现复杂度。基于大衍数列构造准循环低密度校验码的方法,该方法利用大衍数列固定项差对应的值单调递增的特点,构造出的校验矩阵具有准循环结构,节省了校验矩阵的存储空间。 2.算法测试效果 3.算法涉及理论知识概要


【产品运营必备】数据分析实战宝典:从入门到精通,驱动业务增长(附相关材料下载)
小飞象—木兮2025/12/11

木木自由,专注更多数据分析,经营分析、财务分析、商业分析、数据治理、数据要素、数据资产干货以及资料分享木木自由·   数据分析·领地在产品迭代与运营增长的赛道上,数据分析早已不是“加分项”,而是驱动决策的“核心引擎”。很多产品、运营人员面对数据时常常陷入困境:看着后台一堆指标无从下手,明明做了活动用户却不买账,想优化产品却找不到具体方向。其实,数据分析的核心并非复杂的公式,而是“立足场景、解决问题”的思维的方法。在此,【数据分析·领地】整理了一套《数据分析实战宝典》,将围绕产品与运营的高频场景,

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2026 XYZ博客