大模型微调部署实战及类GPT工具的高效使用

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容，希望对使用大语言模型的同学们有所帮助。

文章目录

1. 前言
2. 专栏亮点
3. 你的收获
4. 详细目录

1. 前言

随着时间的齿轮转动到2024年，各种行业大模型如雨后春笋般涌现。如何基于基座模型和领域数据构建行业大模型成为了近期研究和落地的热点方向。因此基于大模型进行微调和部署成为了大多数企业的日常操作，但模型微调存在相当的技术门槛，稍有差池或者经验不足极易造成过拟合（严重的灾难性遗忘）、或者欠拟合（无法有效学习特定领域知识）的情形。

在这里插入图片描述

与此同时，善用AI的人利用各种GPT工具完成写文章、写总结、写代码、阅读论文、文本翻译等日常任务，极大提升了工作和生活的效率。为了帮助大家更好地理解和掌握上述内容，个人精心打造了全面且不断迭代的系统性课程。

在这里插入图片描述

但在大模型实践过程中，往往存在着各种各样的坑，不管是大模型的下载和使用，还是大模型的微调与部署，一个看似简单的小问题就需要花费非专业人士数个小时，更何况很多同学是刚入门不久的小白，所以很容易就从入门走向放弃。

在这里插入图片描述
但市面上的大模型实战课程质量参差不齐，要么步骤不够详细，要么只包含文字（没有必要的截图）。很多同学可能会卡在某个点上很长时间，从易到难比如：无法连接huggingface、下载高速下载github源码、微调前不知从何入手、微调过程中不知如何进行迭代和精进、微调后不知如何选择比较好的checkpoint、微调后无法判断是否达到了预期的效果。

本课程包括以下主要内容：首先，我们将深入解析大模型的基本概念，其中包括从入门到精进的提示工程、主流大模型的System Prompt、GPT和LLaMA模型的进化之路。大模型的部署与推理是模型微调的前提，所以详细介绍了huggingface高速下载模型的实战代码、多种部署大模型API的实战教程、不同语言及其代码（包括Text2SQL）大模型的部署方案。接着，我们将详细讲解大模型微调的技巧和实验方法，包括大模型微调数据集构建方法、大模型微调选择模型的实战技巧、LoRA微调调参的实战技巧、LLama Factory单机和多机微调等实战教程、Lora Adapter可视化的实战教程、判断大模型微调是否产生灾难性遗忘的实战方案、大模型微调出错的解决方案。除此之外，我们将详细讲解GPT工具在不同场景下的高效使用方法，包括智能搜索、阅读论文、文本翻译、代码生成等实际场景。为了让大家更好的使用工作流提升工作效率和接入业务场景，近期也在更新大模型工作流的相关文章。

本专栏致力于以图文并茂、通俗易懂、步骤详尽的形式对大模型重要知识点进行系统性讲解。每一篇都是经过亲身的实践经历总结而来的，已订阅人数超过720+，已更新文章105+，并且将持续更新，近期更新频率为一周2~3篇。帮助多名同学解决大模型部署、微调及其测评等各类实战问题。
在这里插入图片描述

2. 专栏亮点

系统全面的大模型概念详解和实战应用课程，覆盖了大模型理论基础和实战应用的完整路径。
每一篇文章都是经过精心撰写而成的，文章平均质量分数为92（远超其他热门和同类专栏）。
实战文章均来自于亲身的实践经验，为了方便小白学习，通过图文的形式详细介绍了每一步的操作和正确执行结果，方便进行逐步的验证。
持续更新前沿文章，近期更新频率为一周2~3篇，已更新篇数为106篇，目标更新篇数为500篇。

3. 你的收获

掌握大模型的核心概念和应用实战，尤其是对大模型进行微调和部署。
掌握使用GPT工具的方法和技巧，早日成为善用AI的人。
高效学习精炼后的大模型前沿知识，有效提升学习效率。
购买专栏可加入大模型交流群学习，群里还有不定期抽奖送书等福利。

4. 详细目录

第一章：大模型的基础知识与核心概念

ChatGPT启蒙之旅：弟弟妹妹的关键概念入门
GPT内功心法：搜索思维到GPT思维的转换
从用户的角度谈GPT时代技术突破的两大关键逻辑
AIGC提示(prompt)工程之开宗明义篇
AIGC提示(prompt)飞升方法：走向专家之路
GPT-4o模型介绍和使用方法
Claude3系统解读与使用测评
LLaMA模型系统解读
多图详解LLaMA 3的使用方法和进化之路
Meta大佬亲授LLaMA 3的奥秘
从System Prompt来看Claude3、Kimi和ChatGLM4之间的差距
从System Prompt来看GPT-3.5到GPT-4的进化
详解OpenAI大佬每日读物: The Bitter Lesson
如何从宏观层面构建优秀的大语言模型
大模型训练数据多样性的重要性
大模型量化方法总结
查看大模型对应的准确参数量和网络结构的实战代码
详解LangChain Agents
baichuan 2模型使用的注意事项
baichuan(百川)1和2的tokenizer的比较

第二章：大模型的部署与推理

huggingface连接不上的解决方案(持续更新)
github连接不上的解决方案
huggingface高速下载模型的实战代码
计算huggingface模型占用硬盘空间的实战代码
FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析
部署大模型API的实战教程
大模型推理加速框架vllm部署的实战方案
详解FastChat部署大模型API的实战教程
本地部署GPT的实战方案
ChatGPT API实现多轮对话的实战代码
Qwen2本地部署的实战教程
GLM-4本地部署的实战教程
Llama3本地部署的解决方案
中文开源模型Command R+的在线使用和本地部署的解决方案
ChatDoctor本地部署应用的实战方案
通义千问7B本地部署的实战方案
baichuan2(百川2)本地部署的实战方案
CodeLlama本地部署的实战方案
ChatGLM2本地部署的实战方案
ChatGLM3 本地部署的解决方案
ChatGLM3设置角色和工具调用的解决方案
GLM-130B本地部署的实战方案
MiniGPT-4本地部署的实战方案
Vicuna本地部署的实战方案
CPM-Bee本地部署的实战方案
天鹰340亿(AquilaChat2-34B-16K)本地部署的解决方案
Orion-14B-Chat-RAG本地部署的解决方案
Orion-14B-Chat-Plugin本地部署的解决方案
Orion-14B-Chat-Plugin [model server error]解决方案
下载马斯克Grok-1模型的实战代码
大模型推理速度测评的实战代码
LLaMA Factory在预测阶段时添加原有问题的实战代码

第三章：大模型的微调与优化

大模型微调数据集构建方法(持续更新)
大模型LoRA微调调参的实战技巧(持续更新)
大模型微调选择模型的实战技巧(持续更新)
模型全参数训练和LoRA微调所需显存的分析
LLaMA Factory单机微调的实战教程
LLaMA Factory多卡微调的实战教程
基于大模型的Text2SQL微调的实战教程
基于大模型的Text2SQL微调的实战教程(二)
Lora Adapter可视化的实战教程
大模型自我认知微调的实战教程
ChatGLM LoRA微调实战方案
ChatGLM ptuning 的实战方案
判断大模型微调是否产生灾难性遗忘的实战方案
大模型微调和RAG的应用场景
大模型微调出错的解决方案
大模型提问中包括时间的实战方案

第四章：Text2SQL

Text2SQL基座模型选择的实战教程
最强开源Text2SQL大模型本地部署的解决方案
基于大模型的Text2SQL微调的实战教程(新)
Text2SQL中不同数据库SQL之间转换的实战代码
Langchain+本地大语言模型进行数据库操作的实战代码
Text2SQL提问中包括时间的实战方案
Text2SQL中反思纠错的实战方案

第五章：GPT工具的高效使用方法

AIGC时代高效阅读论文实操
AIGC高效进行网页总结的工具使用
高效翻译工具GPT插件的使用教程
国内智能搜索工具实战教程
基于GPT-3.5和GPT-4的免费代码生成工具
搜索神器Perplexity的详细使用方法
搜索神器Phind的详细使用方法
探寻大模型回答9.9和9.11犯错的根本原因
不同问题来评测百度、谷歌、ChatGPT、Phind、GPT-4
速评谷歌开源大模型Gemma 7B
使用AIGC工具巧用Linux系统
使用AIGC工具提升论文阅读效率
使用ChatGPT工具阅读文献的实战教程
使用ChatGPT设计选择题
使用ChatGPT提升记忆效率
用好GPT关键诀窍之上下文学习
用好ChatGPT之准确分配角色
使用范例调教ChatGPT
ChatGPT和GPT-4帮你写人物传记
ChatGPT和GPT-4带你选笔记本电脑
大模型生成人物关系思维导图的实战教程
图文详解GPT-4最强对手Claude2的使用方法
Claude2轻松解决代码Bug的实战方案

第六章：大模型工作流（正在更新中）

通过命令行工作流提升工作效率的实战教程（持续更新）
使用工作流产生高质量翻译内容的实战教程