人工智能相关学习资料汇总

Posted on 2023-12-25 Edited on 2025-12-31 In life Views:

本文旨在整理一份可供参考和学习的专业ChatGPT相关资料，包括ChatGPT相关论文、Github项目、以及当前市场上出现的ChatGPT相关产品等。

本文将持续不断更新，只涵盖最专业的内容。

大模型学习课程或教程

| 名称 | 介绍 | 课程或教程地址 | 发布或发表时间 |

| — | — | — | — |

| The Illustrated Transformer | “Transformer”概念通俗易懂介绍 | The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io) | 2018-06-27 |

大模型项目

| — | — | — | — |

| Vicuna-13B | 一个开源的聊天机器人，通过在从ShareGPT收集的用户共享对话上进行LLaMA微调来训练。使用GPT-4作为评判标准的初步评估显示，Vicuna-13B在超过90％的情况下实现了OpenAI ChatGPT和Google Bard的质量，并且在超过90％ 的情况下优于其他模型（如LLaMA和Stanford Alpaca）。训练Vicuna-13B的成本约为300美元。训练和服务代码以及在线演示可供非商业用途公开使用。 | Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality | by the Team with members from UC Berkeley, CMU, Stanford, and UC San Diego (lmsys.org) | 2023-03-19 |

| LangChain | 一个用于开发由语言模型驱动的应用程序的框架 | https://docs.langchain.com/docs

https://github.com/hwchase17/langchain | 2023-03-24 |

ChatGPT相关大模型论文合集

| 论文分类 | 名称 | 论文链接 | 发表时间

【时间为预印网站最新时间】 |

| — | — | — | — |

| | GPT-1 | Improving Language Understanding by Generative Pre-Training | 2018-06 |

| | GPT-2 | Language Models are Unsupervised Multitask Learners | 2019-02 |

| | GPT-3 | Language Models are Few-Shot Learners | 2020-07-22 |

| | GPT-4 | GPT-4 Technical Report | 2023-03-27 |

| | GPT对美国劳动力市场影响研究论文 | [2303.10130] GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models (arxiv.org) | 2023-03-23 |

| | AIGC完整调查，ChatGPT从GPT-4到GPT-5是你所需要的全部吗？ | A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need? | 2023-03-21 |

| GLM | GLM论文 | GLM: General Language Model Pretraining with Autoregressive Blank Infilling | 2022-03-17 |

| | 人工缪斯：生成式人工智能聊天机器人已经达到了与人类相当的创造力水平 | Artificial muses: Generative Artificial Intelligence Chatbots Have Risen to Human-Level Creativity | 2023-03-21 |

| CodeGeeX | CodeGeeX，一个具有130亿参数的多语言代码生成模型。截至2022年6月，CodeGeeX已经在23种编程语言的8500亿个标记上进行了预训练。广泛的实验表明，在HumanEval-X上，CodeGeeX在代码生成和翻译任务方面都优于规模相似的多语言代码模型。 | CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Evaluations on HumanEval-X | 2023-03-30 |

| BloombergGPT | 基于广泛的金融数据进行训练的500亿参数语言模型，拥有一个3630亿令牌数据集，基于彭博社广泛的数据来源，可能是迄今为止最大规模的特定领域数据集，并增加了来自通用目标数据集的3450亿令牌。通过标准LLM基准测试、开放式金融基准测试以及一套最能反映彭博社预期使用方式的内部基准测试验证了BloombergGPT。通过混合数据集训练得到了一个性能优异且不损失通用LLM基准表现水平但在金融任务上超越现有模型很多倍的模型。 | BloombergGPT: A Large Language Model for Finance | 2023-03-30 |

| HuggingGPT | HuggingGPT是一个协作系统，由LLM作为控制器和许多专家模型作为协作执行者（来自HuggingFace Hub）组成。系统工作流程包括四个阶段：

任务规划：使用ChatGPT分析用户请求以理解其意图，并将其分解为可能可解决的任务。

模型选择：为了解决计划中的任务，ChatGPT基于它们的描述选择托管在Hugging Face上的专家模型。

任务执行：调用并执行每个选定的模型，并将结果返回给ChatGPT。

响应生成：最后，使用ChatGPT集成所有模型的预测，并生成响应。 | HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face | 2023-04-01 |

OpenAI参考资料集锦

| 功能 | 地址 |

| — | — |

| OpenAI 官方Prompt调试 | https://platform.openai.com/playground?mode=chat |

| OpenAI 官方文档 | https://platform.openai.com/docs/introduction |

| OpenAI API文档 | https://platform.openai.com/docs/api-reference |

| OpenAI 官方Prompts示例 | https://platform.openai.com/examples |

| OpenAI 官方论文合集 | https://openai.com/research |

| OpenAI 产品介绍 | https://openai.com/product |

| OpenAI 模型使用价格说明 | https://openai.com/pricing |

| OpenAI 插件API说明 | https://platform.openai.com/docs/plugins/introduction |

ChatGPT相关Github项目

类ChatGPT模型相关Github项目

| — | — | — | — |

| GLM | 清华知识工程和数据挖掘组开源的一个通用语言模型，使用自回归填空目标进行预训练，并可以在各种自然语言理解和生成任务上进行微调。 | https://github.com/THUDM/GLM | 2022-03-17 |

| ChatGLM-6B | 清华知识工程和数据挖掘组开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 | https://github.com/THUDM/ChatGLM-6B | 2023-03 |

| Alpaca | 斯坦福开源的Alpaca 7B模型，一个在52K个指令跟随演示中从LLaMA 7B模型微调而来的模型。在对单轮指令跟随的初步评估中，Alpaca表现出与OpenAI的text-davinci-003相似的定性特征，同时其体积小、易于复制且成本低廉。 | https://github.com/tatsu-lab/stanford_alpaca | 2023-03-13 |

| Visual ChatGPT | 微软开源的视觉ChatGPT，连接了ChatGPT和一系列视觉基础模型，使得在聊天过程中可以发送和接收图片。 | GitHub - microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models | 2023-03-08 |

| Dolly | Databricks的Dolly是一个大型语言模型，它在Databricks机器学习平台上进行了训练。研究表明，当这个两年前的开源模型（GPT-J）仅经过30分钟的精细调整，并针对50,000条记录（斯坦福Alpaca）进行专注语料库训练时，其展现出惊人高质量的指令跟随行为，而这种行为并不是基于该模型构建的基础模型所具有的特征。我们认为这一发现非常重要，因为它证明了创造强大人工智能技术的能力比以前意识到的要容易得多。 | https://github.com/databrickslabs/dolly | 2023-03-24 |

| CodeGeeX | CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现，在鹏城实验室“鹏城云脑II”中的192个节点（共1536个国产昇腾910 AI处理器）上训练而成。截至2022年6月22日，CodeGeeX历时两个月在20多种编程语言的代码语料库（>8500亿Token）上预训练得到。CodeGeeX有以下特点：

●

高精度代码生成：支持生成Python、C++、Java、JavaScript和Go等多种主流编程语言的代码，在HumanEval-X代码生成任务上取得47%~60%求解率，较其他开源基线模型有更佳的平均性能。

●

跨语言代码翻译：支持代码片段在不同编程语言间进行自动翻译转换，翻译结果正确率高，在HumanEval-X代码翻译任务上超越了其它基线模型。

●

自动编程插件：CodeGeeX插件现已上架VSCode插件市场（完全免费），用户可以通过其强大的少样本生成能力，自定义代码生成风格和能力，更好辅助代码编写。

●

模型跨平台开源: 所有代码和模型权重开源开放，用作研究用途。CodeGeeX同时支持昇腾和英伟达平台，可在单张昇腾910或英伟达V100/A100上实现推理。 | https://github.com/THUDM/CodeGeeX | 2023-03-30 |

| AutoGPT | Auto-GPT是一个实验性的开源应用程序，展示了GPT-4语言模型的能力。这个程序由GPT-4驱动，将LLM“思想”链接在一起，以自主地实现您设定的任何目标。作为GPT-4完全自主运行的首批示例之一，Auto-GPT推动了人工智能可能性的界限。 | https://github.com/Torantulino/Auto-GPT | 2023-04-12 |

ChatGPT产品相关Github项目

| 产品名称 | 简介 | 项目地址 |

| — | — | — |

| OpenAI-translator | 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 | https://github.com/yetone/openai-translator |

| sql-translator | 一款基于人工智能的可以将自然语言转换为SQL的开源项目。 | https://github.com/whoiskatrin/sql-translator |

| ChatGPT | 一款封装了ChatGPT网页的桌面版ChatGPT应用。 | https://github.com/lencx/ChatGPT |

| Chatgpt-web | 一款基于Express 和 Vue3 搭建的 ChatGPT 演示网页，可自定义配置OpenAI的API-key来搭建自己的私人ChatGPT。 | https://github.com/Chanzhaoyu/chatgpt-web |

| Chatbox | 跨平台桌面应用程序，用于ChatGPT API（OpenAI API），同时也是一个Prompts调试和管理工具。 | GitHub - Bin-Huang/chatbox: A cross-platform desktop application for ChatGPT API (OpenAI API), also a prompt debugging and management tool. |

ChatGPT相关投研报告

| — | — | — | — |

| 偉祿亞太證券 | 人工智能:AIGC、ChatGPT | https://www.realordapsec.com/wp-content/uploads/2023/02/%E7%A0%94%E7%A9%B6%E5%A0%B1%E5%91%8A-ChatGPT-%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7-SC.pdf | 2023-02-17 |

ChatGPT相关产品

类ChatGPT产品

| 产品名称 | 产品介绍 | 官网地址 |

| — | — | — |

| 文心一言 | 百度发布的一款类似于ChatGPT的产品。 | https://yiyan.baidu.com/welcome |

| New Bing | 微软发布的基于GPT-4的类似于ChatGPT的产品。 | https://www.bing.com/new |

| 通义千问 | 达摩院发布的一款大语言模型产品 | https://tongyi.aliyun.com/ |

| open-assistant | 开放助手（简称OA）是一个基于聊天的开源助手。该项目的愿景是创建一个可以在单个高端消费级GPU上运行的大型语言模型。通过一些修改，Open Assistant也应该能够轻松地与其他第三方应用程序进行接口，并从数据库和互联网中检索信息。 | https://open-assistant.io/ |

ChatGPT非官方产品

| 产品名称 | 产品介绍 | 官网地址 |

| — | — | — |

| Poe | 一款集成了ChatGPT、GPT-4、Claude、Claude+、Sage、Dragonfly的聊天机器人hub | https://poe.com/ |

类ChatGPT AI工具

| 产品工具名称 | 介绍 | 官网地址 |

| — | — | — |

| BloopAI | 一款使用GPT-4和语义代码搜索来理解代码库的AI软件 | https://bloop.ai/ |

| OpenL | 一款基于OpenAI的翻译工具网站。支持15种常见语言，另外还提供了writer功能，可修正语法和润色文章。免费用户有20个额度 | https://openl.io |

| Browse AI | 一款预构建的网络爬虫机器人，可以在2分钟内构建机器人，无需写代码，帮你爬取需要的任何资源。 | https://www.browse.ai/ |

| Hypotenuse AI | 一款基于AI的写作助手。 | https://www.hypotenuse.ai/ |

| There’s an ai for that | 一个收集了能完成很多任务的AI工具集合网站。 | https://theresanaiforthat.com/ |

| Durable AI Website Builder | 基于AI在30秒内构建一个网站。 | https://durable.co/ai-website-builder |

| Delv AI | 一款基于GPT-3的可以帮助从任何文本中进行总结的工具。 | https://www.delv.ai/ |

| Perplexity AI | 一款旨在于替代Google的人工智能搜索引擎。 | https://www.perplexity.ai/ |

| ChatPDF | ChatPDF是与任何PDF快速、简便地聊天的方式，免费且无需登录。 | https://www.chatpdf.com/ |

| ChatExcel | 通过文字聊天实现Excel的交互控制的AI辅助工具 | https://chatexcel.com/ |

| ChatDoc | 一个基于ChatGPT的文件阅读助手，可以快速从PDF中提取、定位和总结信息。 | ChatDOC - Chat with your documents |

| Humata | 一个基于ChatGPT的文件理解助手 | https://www.humata.ai/ |

| LLamaChat | LlamaChat允许您与在Mac本地运行的LLaMa、Alpaca和GPT4All模型进行聊天。可直接下载LLama、Alpaca和GPT4All模型后直接进行使用。 | https://llamachat.app/ |

多模态产品

| 产品名称 | 介绍 | 官网地址 |

| — | — | — |

| Midjourney | AI绘画创作工具 | https://www.midjourney.com/ |

| Stable Diffusion | 一种潜在的文本到图像扩散模型，能够生成逼真的照片，只需输入任何文本即可。它培养了自主创作的自由，产生了令人惊叹的图像，并使数十亿人能够在几秒钟内创造出令人惊叹的艺术作品。 | https://stablediffusionweb.com/ |