LLM记录202304-202306 - 代码天地

LLM记录202304-202306

企业开发 2023-09-09 17:35:37 阅读次数: 0

RLHF

RAFT

RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment
code
在这里插入图片描述

RRHF

RRHF: Rank Responses to Align Language Models with Human Feedback without tears
code
$p_i=\frac{\sum_{t}\log P_{\pi}(y_{i,t}|y_{i,<t})}{\|y_i\|}$
$L_{rank}=\sum_{r_i<r_j}{\max(0,p_i-p_j)}$

猜你喜欢

转载自blog.csdn.net/dragonchow123/article/details/130026411

LLM记录202304-202306

聊聊美剧202306

Oracle Recovery Tools更新—202304

阿里云容器服务 ACK 产品技术动态（202304）

LLM：ChatGLM-6B模型进行P-Tunning训练记录及参数讲解

阿里云容器服务 ACK 产品技术动态（202306）

LLM的Tokenizer

202304读书笔记|《不被定义的女孩》——做最真实最漂亮的自己，依心而行

QTYX量化系统实战案例分享｜均线多头排列遇市场回调-202304

【LLM】LangChain基础使用（构建LLM应用）

LLM应用的例子LLM use cases and tasks

202306读书笔记｜《与诗书在一起》——质而实绮，癯而实腴

QTYX量化系统实战案例分享｜涨停股池中寻找反弹机会-202306

Databricks 开源 LLM AI

LLM背景知识总结

Emergent Abilities of LLM

LLM模型整理

通俗易懂的LLM

【LLM】LangChain 资料大全

大模型(LLM)总结

开源LLM的创建步骤

LLM的工程实践思考

LLM综述-prompts

lynx-llm

llm-attacks

大语言模型LLM

LLM：大语言模型

LLM：Transformers 库

CODE LLM 对比

LLM 相关资料备忘

今日推荐

周排行

python——selenium库的使用

Springboot文件上传与文件映射(保存URL至数据库)完整代码

数据质量评估标准

2.Spring的Bean生命周期和组装方式

MYSQL 查看修改运行时参数

也许CTO并不是终点——没有净土【也许CTO并不是终点开篇】CTO也只不过是CTO罢了

请不要折腾

小米OJ编程题-不一样的排序

Robot Framework与Web界面自动化测试学习笔记：如何判断单选框的选中状态

python菜鸟爬

每日归档

更多

2024-09-20(0)

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)