Skip to content

生成式AI资源

资源来源

仓库地址https://github.com/filipecalegario/awesome-generative-ai

简介: 这是一个精心整理的生成式AI资源列表,涵盖了生成式AI的各个方面,包括模型、工具、应用、教程等,帮助你全面了解和使用生成式AI技术。

生成式AI概述

什么是生成式AI?

生成式AI(Generative AI)是指能够创建新内容的AI系统,包括:

  • 文本生成(如GPT、Claude)
  • 图像生成(如DALL-E、Midjourney)
  • 音频生成(如Whisper、AudioLM)
  • 视频生成(如Sora、Runway)
  • 代码生成(如Codex、StarCoder)

生成式AI的核心技术

  1. 大语言模型(LLM)

    • GPT系列(GPT-3、GPT-4)
    • Claude系列
    • LLaMA系列
    • 其他开源模型
  2. 扩散模型

    • Stable Diffusion
    • DALL-E
    • Midjourney
    • 其他图像生成模型
  3. 多模态模型

    • GPT-4V
    • Claude 3
    • Gemini
    • 其他多模态模型

主要模型

文本生成模型

闭源模型

GPT系列

  • GPT-3.5
  • GPT-4
  • GPT-4 Turbo
  • 特点:强大的文本生成能力
  • 应用:对话、写作、编程等

Claude系列

  • Claude 2
  • Claude 3
  • 特点:长文本支持、安全可靠
  • 应用:长文档分析、对话等

其他闭源模型

  • Gemini(Google)
  • PaLM(Google)
  • 其他商业模型

开源模型

LLaMA系列

  • LLaMA 2
  • LLaMA 3
  • 特点:性能强大、可本地部署
  • 应用:研究、开发等

其他开源模型

  • Mistral
  • Mixtral
  • 其他开源模型

图像生成模型

商业模型

DALL-E

  • DALL-E 2
  • DALL-E 3
  • 特点:高质量图像生成
  • 应用:创意设计、营销等

Midjourney

  • Midjourney v6
  • 特点:艺术性强
  • 应用:艺术创作、设计等

其他商业模型

  • Adobe Firefly
  • 其他商业模型

开源模型

Stable Diffusion

  • Stable Diffusion XL
  • Stable Diffusion 3
  • 特点:开源、可定制
  • 应用:研究、开发等

其他开源模型

  • Flux
  • 其他开源模型

音频生成模型

语音识别

  • Whisper(OpenAI)
  • 特点:多语言支持
  • 应用:转录、翻译等

语音合成

  • ElevenLabs
  • 特点:高质量语音
  • 应用:配音、播客等

音乐生成

  • Suno AI
  • Udio
  • 特点:AI音乐创作
  • 应用:音乐创作、背景音乐等

视频生成模型

商业模型

  • Sora(OpenAI)
  • Runway
  • 特点:高质量视频生成
  • 应用:视频创作、广告等

开源模型

  • Stable Video Diffusion
  • 其他开源模型

主要工具和平台

开发框架

LangChain

  • 框架:应用开发框架
  • 特点:模块化、可扩展
  • 应用:AI应用开发
  • 文档链接

LlamaIndex

  • 框架:数据索引框架
  • 特点:数据连接、索引
  • 应用:RAG应用
  • 文档链接

其他框架

  • Haystack
  • Semantic Kernel
  • 其他框架

部署平台

云服务

  • OpenAI API
  • Anthropic API
  • Google Cloud AI
  • 其他云服务

自部署

  • vLLM
  • TGI
  • Ollama
  • 其他部署工具

开发工具

提示词工具

  • PromptBase
  • FlowGPT
  • 其他提示词工具

评估工具

  • Promptfoo
  • 其他评估工具

监控工具

  • LangSmith
  • 其他监控工具

应用场景

内容创作

文本创作

  • 文章写作
  • 营销文案
  • 创意写作
  • 其他文本创作

图像创作

  • 艺术创作
  • 设计辅助
  • 营销素材
  • 其他图像创作

音频创作

  • 语音合成
  • 音乐创作
  • 音效设计
  • 其他音频创作

视频创作

  • 视频生成
  • 视频编辑
  • 动画制作
  • 其他视频创作

编程辅助

代码生成

  • 代码补全
  • 代码生成
  • 代码优化
  • 其他代码生成

代码审查

  • 代码分析
  • Bug检测
  • 代码优化
  • 其他代码审查

文档生成

  • API文档
  • 技术文档
  • 用户文档
  • 其他文档生成

数据分析

数据分析

  • 数据探索
  • 数据可视化
  • 数据解释
  • 其他数据分析

报告生成

  • 分析报告
  • 总结报告
  • 预测报告
  • 其他报告生成

客户服务

智能客服

  • 自动回复
  • 问题解答
  • 工单处理
  • 其他客服功能

聊天机器人

  • 对话系统
  • 问答系统
  • 其他聊天机器人

学习资源

课程

在线课程

  • Fast.ai课程
  • DeepLearning.AI课程
  • 其他在线课程

实践教程

  • 官方教程
  • 社区教程
  • 其他实践教程

文档

官方文档

  • OpenAI文档
  • Anthropic文档
  • 其他官方文档

社区文档

  • GitHub文档
  • 社区分享
  • 其他社区文档

论文

重要论文

  • Attention is All You Need
  • GPT系列论文
  • 其他重要论文

最新研究

  • arXiv论文
  • 会议论文
  • 其他最新研究

最佳实践

提示词工程

设计原则

  • 清晰明确
  • 提供上下文
  • 指定格式
  • 迭代优化

优化技巧

  • Chain of Thought
  • Few-shot Learning
  • 其他优化技巧

模型选择

选择标准

  • 任务需求
  • 性能要求
  • 成本考虑
  • 其他因素

评估方法

  • 测试评估
  • 用户反馈
  • 其他评估方法

安全考虑

内容安全

  • 内容过滤
  • 输出审查
  • 其他安全措施

数据安全

  • 数据加密
  • 访问控制
  • 其他安全措施

总结

生成式AI正在快速改变我们创建内容的方式,掌握这些资源将帮助你更好地利用这项技术。

核心要点

  1. 了解模型类型

    • 文本生成模型(GPT、Claude、LLaMA等)
    • 图像生成模型(DALL-E、Midjourney、Stable Diffusion等)
    • 音频生成模型(Whisper、ElevenLabs等)
    • 视频生成模型(Sora、Runway等)
  2. 选择合适的工具

    • 根据任务需求选择模型
    • 考虑成本和性能
    • 评估开源和闭源选项
    • 关注最新进展
  3. 掌握最佳实践

    • 提示词工程
    • 模型选择
    • 安全考虑
  4. 持续学习

    • 关注最新研究
    • 参与社区讨论
    • 实践新技术
    • 分享经验

记住

  • 生成式AI发展迅速
  • 持续学习是关键
  • 安全和伦理很重要
  • 实践是最好的学习方式

相关资源

MIT Licensed