数据说话:26 种AI大模型prompt效果比较

本文是针对《Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4》的解读。“有原则的指令是你需要的,用于提问LLaMA-1/2, GPT-3.5/4。”

论文地址:

https://arxiv.org/abs/2312.16171


created: 2024-09-22T15:58:36 (UTC +08:00)
tags: [工智能,文章,编程语言,不完美妈妈,脚本语言]
source: https://www.toutiao.com/article/7407289543713473039/

author: ChatGPT扫地僧

在不同尺寸的模型

“回答质量增强:无论是小型(7B)、中型(13B)还是大型语言模型(70B以及GPT-4.5/4),其回答质量均有显著提升。特别是技巧2、5、15、16、25和26,在提升大型模型的表现上尤为突出。技巧14(你将受到惩罚)则在所有规模的模型中均显示出显著的改进效果:

鼓励语言模型通过提问来获取更多信息,直到它能够充分回答你的问题。例如,可以这样指示:“从现在开始,你可以通过向我提问来收集信息,直到你能够回答我的问题为止。””

精确度增强:应用这些策略后,各类语言模型的平均精确度提升幅度在20%至40%之间。具体来说,小型和中型模型的精确度提升范围是10%到40%,而大型模型的精确度提升更是超过了40%。在比较精确度方面,所有模型的性能平均提升了超过10%,其中大型模型的提升幅度甚至达到了20%以上。