LangChain资源

资源来源

仓库地址：https://github.com/kyrolabs/awesome-langchain

简介：这是一个精心整理的LangChain资源列表，涵盖了LangChain框架的各个方面，包括核心概念、组件、应用、教程等，帮助你全面掌握和使用LangChain框架。

LangChain概述

什么是LangChain？

LangChain是一个用于开发由语言模型驱动的应用程序的框架，它提供了：

模块化组件：可组合的组件，易于构建复杂应用
链式调用：将多个组件链接在一起
智能体：让LLM与外部世界交互
记忆管理：管理对话历史和上下文
数据连接：连接到各种数据源

为什么使用LangChain？

简化开发：提供高级抽象，简化LLM应用开发
模块化设计：组件可组合，易于扩展
丰富的集成：支持多种LLM、工具和数据源
活跃的社区：持续更新，丰富的资源
生产就绪：适合构建生产级应用

核心概念

1. 模型（Models）

语言模型（LLMs）

基础语言模型
文本生成
文本补全

聊天模型（Chat Models）

对话模型
消息历史
多轮对话

嵌入模型（Embeddings）

文本嵌入
语义搜索
相似度计算

2. 提示词（Prompts）

提示词模板（Prompt Templates）

可重用的提示词
参数化输入
格式化输出

示例选择器（Example Selectors）

Few-shot学习
动态示例选择
示例优化

输出解析器（Output Parsers）

结构化输出
格式验证
类型转换

3. 数据连接（Data Connection）

文档加载器（Document Loaders）

多种格式支持
数据源连接
文档处理

文本分割器（Text Splitters）

智能分割
语义完整
大小控制

向量存储（Vector Stores）

向量数据库
相似度搜索
高效检索

检索器（Retrievers）

信息检索
混合检索
重排序

4. 链（Chains）

基础链（Basic Chains）

LLM链
简单链
组合链

高级链（Advanced Chains）

顺序链
路由链
转换链

5. 智能体（Agents）

Agent类型

ReAct Agent
OpenAI Functions Agent
其他Agent类型

工具（Tools）

内置工具
自定义工具
工具集成

执行器（Agent Executors）

Agent执行
循环控制
错误处理

6. 记忆（Memory）

记忆类型

对话缓冲
对话摘要
对话窗口
其他记忆类型

记忆组件

记忆存储
记忆检索
记忆更新

7. 回调（Callbacks）

回调处理器

流式输出
日志记录
性能监控

自定义回调

自定义处理器
事件处理
集成扩展

主要组件详解

1. 模型集成

支持的LLM

OpenAI

GPT-3.5
GPT-4
GPT-4 Turbo
文档链接

Anthropic

Claude 2
Claude 3
文档链接

开源模型

LLaMA
Mistral
其他开源模型
Hugging Face

使用示例

python

from langchain_openai import ChatOpenAI

# 初始化模型
llm = ChatOpenAI(model="gpt-4")

# 调用模型
response = llm.invoke("Hello, how are you?")
print(response.content)

2. 提示词管理

提示词模板

python

from langchain.prompts import ChatPromptTemplate

# 创建提示词模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "You are a helpful assistant."),
    ("user", "{input}")
])

# 使用模板
formatted_prompt = prompt.format(input="Hello!")
print(formatted_prompt)

输出解析器

python

from langchain.output_parsers import StructuredOutputParser
from langchain.prompts import PromptTemplate

# 创建输出解析器
parser = StructuredOutputParser.from_response_schemas([
    ResponseSchema(name="answer", description="The answer to the question"),
    ResponseSchema(name="confidence", description="Confidence score")
])

# 使用解析器
format_instructions = parser.get_format_instructions()
prompt = PromptTemplate(
    template="Answer the question.
{format_instructions}
Question: {question}",
    input_variables=["question"],
    partial_variables={"format_instructions": format_instructions}
)

3. 数据连接

文档加载

python

from langchain.document_loaders import TextLoader

# 加载文档
loader = TextLoader("example.txt")
documents = loader.load()

文本分割

python

from langchain.text_splitter import RecursiveCharacterTextSplitter

# 分割文本
splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200
)
splits = splitter.split_documents(documents)

向量存储

python

from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings

# 创建向量存储
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=OpenAIEmbeddings()
)

# 相似度搜索
results = vectorstore.similarity_search("query")

4. 链式调用

简单链

python

from langchain.chains import LLMChain

# 创建链
chain = LLMChain(
    llm=llm,
    prompt=prompt
)

# 运行链
result = chain.run(input="Hello!")

顺序链

python

from langchain.chains import SequentialChain

# 创建顺序链
overall_chain = SequentialChain(
    chains=[chain1, chain2, chain3],
    input_variables=["input"],
    output_variables=["output"]
)

# 运行链
result = overall_chain({"input": "Hello!"})

5. 智能体

创建Agent

python

from langchain.agents import initialize_agent, Tool
from langchain.tools import DuckDuckGoSearchRun

# 定义工具
search = DuckDuckGoSearchRun()
tools = [
    Tool(
        name="Search",
        func=search.run,
        description="Useful for searching the internet"
    )
]

# 初始化Agent
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent="zero-shot-react-description"
)

# 运行Agent
result = agent.run("What is LangChain?")

6. 记忆管理

对话缓冲记忆

python

from langchain.memory import ConversationBufferMemory

# 创建记忆
memory = ConversationBufferMemory()

# 添加对话
memory.save_context({"input": "Hi"}, {"output": "Hello!"})

# 获取历史
history = memory.load_memory_variables({})

对话摘要记忆

python

from langchain.memory import ConversationSummaryMemory

# 创建摘要记忆
memory = ConversationSummaryMemory(llm=llm)

# 添加对话
memory.save_context({"input": "Hi"}, {"output": "Hello!"})

# 获取摘要
summary = memory.load_memory_variables({})

应用场景

1. 问答系统

RAG问答

文档问答
知识库问答
多轮问答

实现步骤

加载文档
分割文本
创建向量存储
创建检索器
构建问答链

2. 聊天机器人

对话系统

客服机器人
助手机器人
娱乐机器人

实现要点

记忆管理
上下文保持
个性化

3. 内容生成

文本生成

文章写作
营销文案
创意写作

实现要点

提示词设计
输出控制
质量保证

4. 数据分析

数据分析

数据探索
数据可视化
报告生成

实现要点

数据连接
分析链
输出格式化

5. Agent应用

智能Agent

任务自动化
工作流自动化
决策支持

实现要点

工具集成
规划能力
错误处理

学习资源

官方资源

文档

教程

社区资源

GitHub

博客

示例

视频资源

官方视频

社区视频

最佳实践

1. 提示词设计

设计原则

清晰明确
提供上下文
指定格式
迭代优化

优化技巧

Chain of Thought
Few-shot Learning
其他优化技巧

2. 链式调用

设计原则

模块化设计
清晰的输入输出
错误处理
性能优化

最佳实践

使用适当的链类型
避免过深的链
添加日志记录
监控性能

3. 智能体

设计原则

明确Agent目标
选择合适的工具
设计清晰的规划
处理错误情况

最佳实践

使用适当的Agent类型
限制工具数量
添加记忆
监控执行

4. 性能优化

优化技巧

缓存结果
批处理
并行处理
使用适当的模型

监控指标

响应时间
Token使用
成本
错误率

5. 安全考虑

内容安全

输入验证
输出过滤
速率限制
其他安全措施

数据安全

数据加密
访问控制
审计日志
其他安全措施

常见问题

Q1: LangChain适合什么场景？

问答系统
聊天机器人
内容生成
数据分析
Agent应用

Q2: 如何选择合适的LLM？

任务需求
性能要求
成本考虑
部署方式

Q3: 如何优化LangChain应用性能？

缓存结果
批处理
并行处理
使用适当的模型

Q4: 如何处理长文本？

使用文本分割器
使用摘要记忆
使用RAG
其他方法

总结

LangChain是构建LLM应用的强大框架，掌握它将帮助你快速开发高质量的AI应用。

核心要点：

核心概念
- 模型（Models）：LLM、Chat Models、Embeddings
- 提示词（Prompts）：模板、示例选择器、输出解析器
- 数据连接（Data Connection）：文档加载、文本分割、向量存储
- 链（Chains）：基础链、高级链
- 智能体（Agents）：Agent类型、工具、执行器
- 记忆（Memory）：记忆类型、记忆组件
- 回调（Callbacks）：回调处理器、自定义回调
应用场景
- 问答系统（RAG）
- 聊天机器人
- 内容生成
- 数据分析
- Agent应用
最佳实践
- 提示词设计
- 链式调用
- 智能体设计
- 性能优化
- 安全考虑
学习路径
- 从官方文档开始
- 学习核心概念
- 实践示例项目
- 构建实际应用
- 参与社区

记住：

LangChain发展迅速，持续关注更新
从简单开始，逐步深入
实践是最好的学习方式
参与社区讨论和分享
关注安全和性能

LangChain资源 ​

资源来源 ​

LangChain概述 ​

什么是LangChain？ ​

为什么使用LangChain？ ​

核心概念 ​

1. 模型（Models） ​

2. 提示词（Prompts） ​

3. 数据连接（Data Connection） ​

4. 链（Chains） ​

5. 智能体（Agents） ​

6. 记忆（Memory） ​

7. 回调（Callbacks） ​

主要组件详解 ​

1. 模型集成 ​

2. 提示词管理 ​

3. 数据连接 ​

4. 链式调用 ​

5. 智能体 ​

6. 记忆管理 ​

应用场景 ​

1. 问答系统 ​

2. 聊天机器人 ​

3. 内容生成 ​

4. 数据分析 ​

5. Agent应用 ​

学习资源 ​

官方资源 ​

社区资源 ​

视频资源 ​

最佳实践 ​

1. 提示词设计 ​

2. 链式调用 ​

3. 智能体 ​

4. 性能优化 ​

5. 安全考虑 ​

常见问题 ​

Q1: LangChain适合什么场景？ ​

Q2: 如何选择合适的LLM？ ​

Q3: 如何优化LangChain应用性能？ ​

Q4: 如何处理长文本？ ​

总结 ​

相关资源 ​

LangChain资源

资源来源

LangChain概述

什么是LangChain？

为什么使用LangChain？

核心概念

1. 模型（Models）

2. 提示词（Prompts）

3. 数据连接（Data Connection）

4. 链（Chains）

5. 智能体（Agents）

6. 记忆（Memory）

7. 回调（Callbacks）

主要组件详解

1. 模型集成

2. 提示词管理

3. 数据连接

4. 链式调用

5. 智能体

6. 记忆管理

应用场景

1. 问答系统

2. 聊天机器人

3. 内容生成

4. 数据分析

5. Agent应用

学习资源

官方资源

社区资源

视频资源

最佳实践

1. 提示词设计

2. 链式调用

3. 智能体

4. 性能优化

5. 安全考虑

常见问题

Q1: LangChain适合什么场景？

Q2: 如何选择合适的LLM？

Q3: 如何优化LangChain应用性能？

Q4: 如何处理长文本？

总结

相关资源