微调 (深度学习)

微调（又称大模型微调，英语：fine-tuning）是深度学习中迁移学习的一种方法，其中预训练模型的权重会在新数据上进行训练^[1]。微调可以在整个神经网络上执行，也可以仅在其部分层上执行，此时未进行微调的层会被“冻结”（在反向传播步骤中不更新）^[2]。模型还可以通过“适配器”进行增强，适配器的参数远少于原始模型，通过调整适配器的权重并保持模型的其余权重不变的方式，以参数有效的方式进行微调^[3]。

对于一些体系结构，比如卷积神经网络，通常会将较早的层（靠近输入层的层）冻结，因为它们捕捉到较低层次的特征，而较后的层通常能够识别更高层次的特征，这些特征可能更相关于模型训练的任务。^[2]^[4]

对于在大型和通用语料库上进行预训练的模型，通常通过重用模型的参数作为起点，并添加一个从头开始训练的任务特定层进行微调。^[5] 对整个模型进行微调也很常见，通常会产生更好的结果，但计算成本更高。^[6]

微调通常通过监督学习完成，但也有使用弱监督（英语：Weak supervision）进行模型微调的技术。^[7] 微调可以与基于人类反馈的强化学习目标相结合，以生成像ChatGPT（GPT-3的微调版本）和Sparrow（英语：Sparrow (bot)）等语言模型。^[8]^[9]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

微调 (深度学习)

变种

低秩适应

应用领域

自然语言处理

商业模型

参见

参考资料

Wikiwand - on