7.5 Prompting Evaluation开发实战

7.5 Prompting Evaluation开发实战
本节一个很重要的点是模型评估(Evaluation),整个评估的理想做法是,基于模型去评估模型,同时在必要的时候加入第三方信息,这里讲的评估很有用,但是如果从工业级强度的角度,它的工业级强度还是不够的,以后会跟大家分享更多的内容。
接下来,我们在上一节开发实战的基础上,在只有一个正确答案的情况下,评估大语言模型(LLM)的回答。Gavin大咖微信:NLP_Matrix_Space
调用utils.get_products_and_category方法,获取产品目录中的产品和类别列表。

1.	print(utils)
2.	products_and_category = utils.get_products_and_category()
3.	products_and_category 

运行结果为:

 

猜你喜欢

转载自blog.csdn.net/duan_zhihua/article/details/131579512
7.5