7.5 Prompting Evaluation开发实战
本节一个很重要的点是模型评估(Evaluation),整个评估的理想做法是,基于模型去评估模型,同时在必要的时候加入第三方信息,这里讲的评估很有用,但是如果从工业级强度的角度,它的工业级强度还是不够的,以后会跟大家分享更多的内容。
接下来,我们在上一节开发实战的基础上,在只有一个正确答案的情况下,评估大语言模型(LLM)的回答。Gavin大咖微信:NLP_Matrix_Space
调用utils.get_products_and_category方法,获取产品目录中的产品和类别列表。
1. print(utils)
2. products_and_category = utils.get_products_and_category()
3. products_and_category
运行结果为: