OpenAI在RAG应用上的的最佳实践++

​客户需求:他们有大量文档(比如10万份),希望模型只基于这些文档进行知识检索。

解决方案:

  1. 直接将PDF和docx文件嵌入,准确率45%
  2. 经过20次调优迭代,解决细节小Bug,准确率到65%
  3. 基于规则进行优化,譬如先判断问题属于什么领域,然后再回答,效果提升到85%
  4. 数据存在结构化数据(如表格),为此定制提取解决,准确率提升到98%