Vast.ai LLM 大语言模型使用手册（1）

一、初始化LLM WebUI机器

1.注册账号

打开：https://cloud.vast.ai，进行账号注册

2.绑定信用卡& 充值10美金

进入 BILLING菜单 -> 绑定信用卡????（visa 银联信用卡即可） -> 邮箱验证

3.选择模型

进入TEMPLATES 菜单-> 选择 Oobabooga LLM WebUI（LLaMA2）镜像

4.选择机器

之前选择的 Oobabooga LLM WebUI（LLaMA2）镜像就会出现在左上角的框中，选择机器配置：1X RTX 4090（24G 显存），一个模型大概20~30G ，所以磁盘空间需要选大一些。

5.等待机器初始化

机器选择完以后可以在INSTANCES 菜单里面等待机器初始化，当看到【OPEN】表示机器已经准备好了，可以连上去。大概3min左右的初始化时间。

6.注销机器（不使用的时候记得删除机器，暂停的机器收取存储费用）

暂停机器，收存储费用，一个晚上大概1美金。下次登录东西还在
删除机器，不收费。建议删除机器，省钱

二、LLM模型加载和测试

1.挑选LLM模型

https://huggingface.co/ 网站挑选需要评估的模型

uncensored/unfiltered 不进行过滤，因为AI女友有软色情

eg：复制模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

2.下载模型

7B模型

将模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ 放置在 Modl Tab页进行下载，模型下载完成以后可以看到 Done!

3.加载模型

1.在Model 先刷新，然后就可以在下拉菜单上看到刚刚下载的模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

2.下拉框选中模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

3.点击【Reload】按钮，如果模型加载成功可以看到对应的提示tips

4.选择模板

https://huggingface.co/TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

根据上面的模型说明，查找对应的prompt 模板，然后在下拉选项中选择

5.设置Chat characters

具体详情参见：https://github.com/oobabooga/text-generation-webui/blob/main/docs/Chat-mode.md

下面的 Context 是根据我们自己业务中中的504 朋克女孩的prompt进行修改而成的。修改完以后记得保存对应的模型

6.进行对话

选择chat ，然后开始对话

7.导出聊天记录

把对应的聊天内容保留下来，记录到文档中

秒客网