Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 1|回復: 0

基于提示的调整方法的简化比较(来源:作者提供的图片)

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2025-3-6 17:06:41 | 顯示全部樓層 |閱讀模式
几乎同时发布的前缀调优[4] 可以简化为即时调优,但应用于模型的每个注意层。最后, P 调优[5] 直接将标记添加到输入而不是嵌入。为了实现这一点,它使用轻量级 LSTM 或 MLP 从可训练嵌入参数中预测标记。

基于提示的调整方法的简化比较(来源:作者提供的图片)
适配器
适配器 [5] 是另一种基于加法的方法,常用 捷克共和国电报数据 于微调 LLM。它与前缀调整有关,因为它会在模型​​的子层中添加可训练的权重。但是,它在每个 Transformer 块的每个子层的两个不同位置添加小型全连接网络,而不是仅在嵌入上添加前缀。

适配器块采用瓶颈架构来减少参数数量。尺寸仅供参考。(来源:作者提供的图片)
适配器块采用瓶颈架构来减少参数数量。尺寸仅供参考。(来源:作者提供的图片)
低秩适应
低秩自适应 (LoRA) [7] 可能是最常用的基于重参数化的方法。重参数化方法背后的理念是利用低秩近似方法,旨在用较小的矩阵近似大矩阵。因此,传统的降维方法(如 PCA)就是低秩近似的例子。

在 LoRA 中,重点不是直接近似权重,而是近似权重更新,权重更新被分解为两个较小维度的矩阵。在微调过程中,只有这些矩阵通过反向传播进行

回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇

GMT+8, 2025-4-5 08:27 , Processed in 0.034464 second(s), 18 queries .

抗攻擊 by GameHost X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |