Vast.ai LLM 大语言模型使用手册(1)

时间:2024-10-27 19:44:59

一、初始化LLM WebUI机器

1.注册账号

打开:https://cloud.vast.ai,进行账号注册

2.绑定信用卡& 充值10美金

进入 BILLING菜单 -> 绑定信用卡????(visa 银联信用卡即可) -> 邮箱验证

3.选择模型

进入TEMPLATES 菜单-> 选择 Oobabooga LLM WebUI(LLaMA2)镜像

4.选择机器

之前选择的 Oobabooga LLM WebUI(LLaMA2)镜像就会出现在左上角的 框中,选择机器配置:1X RTX 4090(24G 显存), 一个模型大概20~30G ,所以 磁盘空间需要选大一些。

5.等待机器初始化

机器选择完以后 可以在INSTANCES 菜单里面等待机器初始化,当看到【OPEN】表示机器已经准备好了,可以连上去。大概3min左右的初始化时间。

6.注销机器(不使用的时候记得删除机器,暂停的机器收取存储费用

  • 暂停机器,收存储费用,一个晚上大概1美金。下次登录东西还在

  • 删除机器,不收费。建议删除机器,省钱

二、LLM模型加载和测试

1.挑选LLM模型

https://huggingface.co/ 网站挑选需要评估的模型

uncensored/unfiltered 不进行过滤,因为AI女友有软色情

eg:复制模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

2.下载模型

7B模型

将 模型名称 TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ 放置在 Modl Tab页进行下载,模型下载完成以后可以看到 Done!

3.加载模型

1.在Model 先刷新,然后就可以在下拉菜单上看到刚刚下载的模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

2.下拉框选中模型名称TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

3.点击【Reload】按钮,如果模型加载成功可以看到 对应的 提示tips

4.选择模板

https://huggingface.co/TheBloke/Wizard-Vicuna-7B-Uncensored-GPTQ

根据上面的模型说明, 查找对应的prompt 模板,然后在下拉选项中选择

5.设置Chat characters

具体详情参见:https://github.com/oobabooga/text-generation-webui/blob/main/docs/Chat-mode.md

下面的 Context 是根据我们自己业务中 中的504 朋克女孩的prompt进行修改而成的。修改完以后记得保存对应的模型

6.进行对话

选择chat ,然后开始对话

7.导出聊天记录

把对应的聊天内容保留下来,记录到文档中