Prompt本质解密及Evaluation实战与源码解析(一) - 代码天地

Prompt本质解密及Evaluation实战与源码解析(一)

业界资讯 2023-07-21 01:38:14 阅读次数: 0

第9章 Prompt本质解密及Evaluation实战与源码解析
9.1 Customer Service案例
本节主要谈提示词（Prompt）内部的工作机制，围绕案例、源码、论文三个维度展开。首先，我们可以看一下代码部分，这是对基于大模型应用程序开发的一个评估（Evaluation），这显然是一个至关重要的内容。大家做所有基于机器学习的模型，或者所有NLP的项目，对应用程序的评估是一个核心性的东西，因为程序的版本升级或者迭代，需对程序的表现进行评估，提供一些基本的数据，但是对大模型的评估，它跟传统的机器学习不太一样，尤其是基于GPT系列或者生成语言模型，因为它生成的内容，和传统经典意义上的基于内容和标签进行评估，不太完全一样。
Gavin大咖微信：NLP_Matrix_Space
OpenAI官方提供了一些指导，DeepLearning.AI借助OpenAI的一些指导思想，提出了对结果评估的一些具体步骤，我们来看一下，DeepLearning.AI提供的示例中，它的提示词写的非常经典，第一是因为它有效，第二是其他很多开源框架和产品中，都会有类似的实现或者类似的提示词。

1.	def eval_with_rubric(test_set, assistant_answer

猜你喜欢

转载自blog.csdn.net/duan_zhihua/article/details/131679540

Prompt本质解密及Evaluation实战与源码解析(一)

Prompt本质解密及Evaluation实战与源码解析（三）

Prompt本质解密及Evaluation实战与源码解析（二）

源码解析Django CBV的本质

ItemDecoration深入解析与实战（一）——源码分析

Netty源码面试解析实战（一）

Netty源码解析与实战

Quartz实战与源码解析

透过源码看本质，从源码解析Spring Security认证流程

CoT及ReAct解密与实战（一）

一眼就解密解析

7.5 Prompting Evaluation开发实战

Spark定制班第1课：通过案例对Spark Streaming透彻理解三板斧之一：解密Spark Streaming另类实验及Spark Streaming本质解析

JDK源码解析实战 - AbstractQueuedSynchronizer源码解析

《Android源码设计模式解析与实战》学习笔记（一）

一文详解RocketMQ-Spring的源码解析与实战

《Kafka源码解析与实战》PDF

TensorFlow技术解析与实战源码

ThreadLocal源码解析及实战应用

IO实战一：Apk加解密

LangChain源码逐行解密之LLMs(一)

AQS源码解析(一)-AtomicBoolean源码解析

spring源码解析（一）

Kombu 源码解析一

ThreadPoolExcuter源码解析（一）

Volley源码解析(一)

Atlas 源码解析（一）

okhttp源码解析(一)

dva源码解析（一）

OkHttp源码解析（一）

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)