开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界-Lora-V100(四)

时间:2024-09-29 22:42:54

一、前言

    本篇文章将使用LLaMA-Factory去高效微调(命令和界面方式)QWen2-VL系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。


二、术语介绍

2.1. LoRA微调

    LoRA (Low-Rank Adaptation) 用于微调大型语言模型 (LLM)。  是一种有效的自适应策略,它不会引入额外的推理延迟,并在保持模型质量的同时显着减少下游任务的可训练参数数量。

2.2.参数高效微调(PEFT) 

    仅微调少量 (额外) 模型参数,同时冻结预训练 LLM 的大部分参数,从而大大降低了计算和存储成本。

2.3. LLaMA-Factory

    是一个与 LLaMA(Large Language Model Meta AI)相关的项目,旨在为用户提供一种简化和优化的方式来训练、微调和部署大型语言模型。该工具通常包括一系列功能,如数据处理、模型配置、训练监控等,以帮助研究人员和开发者更高效地使用 LLaMA 模型。

    LLaMA-Factory支持的模型列表: