用户指南Copy MarkdownOpen改进结果用真实问题测试,识别薄弱回答,并在不靠猜测的情况下改进助手。使用真实问题 最好的测试问题,就是用户现在真实会提的问题。 看问题属于哪一类 如果事实不准,说明缺少正确来源或来源已经过期。 如果事实没问题,但回答感觉不对,说明需要更好的示例。 如果相似问题得到非常不同的回答,说明项目想做的事情太多了。 小步改进 添加缺失来源 删除薄弱来源 添加更好的示例 收紧助手说明 重跑同一组测试 什么叫真正进步 同一批难题应该随着时间越来越好,助手在一个明确任务上的可信度也应该提高。 下一步 分享你的助手选择正确的方案判断你的项目需要 retrieval、fine-tuning,还是两者都需要。分享你的助手判断助手什么时候算准备好了,并避免过早上线。