LLM-大模型训练-步骤(三):指令精调【Superviser Fine-Tuning】【中文指令语料】【训练方式与无监督学习一样】【指令语料样式:instruction+input+output】

使用LoRA的指令微调阶段。该阶段让模型能够理解人类的指令并输出合适的内容。




GitHub - zjunlp/KnowLM: Knowledgable Large Language Model Framework.

训练细节 · ymcui/Chinese-LLaMA-Alpaca Wiki · GitHub 

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/131368235