OpenAI在RAG应用上的的最佳实践++ - vim's notes

OpenAI在RAG应用上的的最佳实践++

客户需求：他们有大量文档（比如10万份），希望模型只基于这些文档进行知识检索。

解决方案：

直接将PDF和docx文件嵌入，准确率45%
经过20次调优迭代，解决细节小Bug，准确率到65%
基于规则进行优化，譬如先判断问题属于什么领域，然后再回答，效果提升到85%
若数据里存在结构化数据（如表格），为此定制提取解决，准确率提升到98%