生成式AI资源

资源来源

仓库地址：https://github.com/filipecalegario/awesome-generative-ai

简介：这是一个精心整理的生成式AI资源列表，涵盖了生成式AI的各个方面，包括模型、工具、应用、教程等，帮助你全面了解和使用生成式AI技术。

生成式AI概述

什么是生成式AI？

生成式AI（Generative AI）是指能够创建新内容的AI系统，包括：

文本生成（如GPT、Claude）
图像生成（如DALL-E、Midjourney）
音频生成（如Whisper、AudioLM）
视频生成（如Sora、Runway）
代码生成（如Codex、StarCoder）

生成式AI的核心技术

大语言模型（LLM）
- GPT系列（GPT-3、GPT-4）
- Claude系列
- LLaMA系列
- 其他开源模型
扩散模型
- Stable Diffusion
- DALL-E
- Midjourney
- 其他图像生成模型
多模态模型
- GPT-4V
- Claude 3
- Gemini
- 其他多模态模型

主要模型

文本生成模型

闭源模型

GPT系列

GPT-3.5
GPT-4
GPT-4 Turbo
特点：强大的文本生成能力
应用：对话、写作、编程等

Claude系列

Claude 2
Claude 3
特点：长文本支持、安全可靠
应用：长文档分析、对话等

其他闭源模型

Gemini（Google）
PaLM（Google）
其他商业模型

开源模型

LLaMA系列

LLaMA 2
LLaMA 3
特点：性能强大、可本地部署
应用：研究、开发等

其他开源模型

Mistral
Mixtral
其他开源模型

图像生成模型

商业模型

DALL-E

DALL-E 2
DALL-E 3
特点：高质量图像生成
应用：创意设计、营销等

Midjourney

Midjourney v6
特点：艺术性强
应用：艺术创作、设计等

其他商业模型

Adobe Firefly
其他商业模型

开源模型

Stable Diffusion

Stable Diffusion XL
Stable Diffusion 3
特点：开源、可定制
应用：研究、开发等

其他开源模型

Flux
其他开源模型

音频生成模型

语音识别

Whisper（OpenAI）
特点：多语言支持
应用：转录、翻译等

语音合成

ElevenLabs
特点：高质量语音
应用：配音、播客等

音乐生成

Suno AI
Udio
特点：AI音乐创作
应用：音乐创作、背景音乐等

视频生成模型

商业模型

Sora（OpenAI）
Runway
特点：高质量视频生成
应用：视频创作、广告等

开源模型

Stable Video Diffusion
其他开源模型

主要工具和平台

开发框架

LangChain

框架：应用开发框架
特点：模块化、可扩展
应用：AI应用开发
文档链接

LlamaIndex

框架：数据索引框架
特点：数据连接、索引
应用：RAG应用
文档链接

其他框架

Haystack
Semantic Kernel
其他框架

部署平台

云服务

OpenAI API
Anthropic API
Google Cloud AI
其他云服务

自部署

vLLM
TGI
Ollama
其他部署工具

开发工具

提示词工具

PromptBase
FlowGPT
其他提示词工具

评估工具

Promptfoo
其他评估工具

监控工具

LangSmith
其他监控工具

应用场景

内容创作

文本创作

文章写作
营销文案
创意写作
其他文本创作

图像创作

艺术创作
设计辅助
营销素材
其他图像创作

音频创作

语音合成
音乐创作
音效设计
其他音频创作

视频创作

视频生成
视频编辑
动画制作
其他视频创作

编程辅助

代码生成

代码补全
代码生成
代码优化
其他代码生成

代码审查

代码分析
Bug检测
代码优化
其他代码审查

文档生成

API文档
技术文档
用户文档
其他文档生成

数据分析

数据分析

数据探索
数据可视化
数据解释
其他数据分析

报告生成

分析报告
总结报告
预测报告
其他报告生成

客户服务

智能客服

自动回复
问题解答
工单处理
其他客服功能

聊天机器人

对话系统
问答系统
其他聊天机器人

学习资源

课程

在线课程

Fast.ai课程
DeepLearning.AI课程
其他在线课程

实践教程

官方教程
社区教程
其他实践教程

文档

官方文档

OpenAI文档
Anthropic文档
其他官方文档

社区文档

GitHub文档
社区分享
其他社区文档

论文

重要论文

Attention is All You Need
GPT系列论文
其他重要论文

最新研究

arXiv论文
会议论文
其他最新研究

最佳实践

提示词工程

设计原则

清晰明确
提供上下文
指定格式
迭代优化

优化技巧

Chain of Thought
Few-shot Learning
其他优化技巧

模型选择

选择标准

任务需求
性能要求
成本考虑
其他因素

评估方法

测试评估
用户反馈
其他评估方法

安全考虑

内容安全

内容过滤
输出审查
其他安全措施

数据安全

数据加密
访问控制
其他安全措施

总结

生成式AI正在快速改变我们创建内容的方式，掌握这些资源将帮助你更好地利用这项技术。

核心要点：

了解模型类型
- 文本生成模型（GPT、Claude、LLaMA等）
- 图像生成模型（DALL-E、Midjourney、Stable Diffusion等）
- 音频生成模型（Whisper、ElevenLabs等）
- 视频生成模型（Sora、Runway等）
选择合适的工具
- 根据任务需求选择模型
- 考虑成本和性能
- 评估开源和闭源选项
- 关注最新进展
掌握最佳实践
- 提示词工程
- 模型选择
- 安全考虑
持续学习
- 关注最新研究
- 参与社区讨论
- 实践新技术
- 分享经验

记住：

生成式AI发展迅速
持续学习是关键
安全和伦理很重要
实践是最好的学习方式

生成式AI资源 ​

资源来源 ​

生成式AI概述 ​

什么是生成式AI？ ​

生成式AI的核心技术 ​

主要模型 ​

文本生成模型 ​

图像生成模型 ​

音频生成模型 ​

视频生成模型 ​

主要工具和平台 ​

开发框架 ​

部署平台 ​

开发工具 ​

应用场景 ​

内容创作 ​

编程辅助 ​

数据分析 ​

客户服务 ​

学习资源 ​

课程 ​

文档 ​

论文 ​

最佳实践 ​

提示词工程 ​

模型选择 ​

安全考虑 ​

总结 ​

相关资源 ​

生成式AI资源

资源来源

生成式AI概述

什么是生成式AI？

生成式AI的核心技术

主要模型

文本生成模型

图像生成模型

音频生成模型

视频生成模型

主要工具和平台

开发框架

部署平台

开发工具

应用场景

内容创作

编程辅助

数据分析

客户服务

学习资源

课程

文档

论文

最佳实践

提示词工程

模型选择

安全考虑

总结

相关资源