你花了好几周时间打磨你的提示。你建立了一个强大的检索系统。你验证了进入上下文窗口的每一条数据。 然而,你的RAG(检索增强生成)机器人仍然自信地告诉用户完全错误的信息。 这种情况不常发生,但一旦发生,就会破坏用户信任。生产环境中的大型语言模型问题不仅是让他们回答;而是知道他们什么时候在撒谎(产生幻觉)。 标准的软件工程实践,比如基于正则表达式的单元测试,无法处理非确定性自然语言输出。我们需要在技术栈中增加一层新内容。 以下是我如何利用TypeScript、Node.js和PostgreSQL构建一个“废话检测器”中…