最近两天使用千问14B模型,构建客户信息的总结摘要。在这个过程中,要求将word文档中的结构化数据(表格),进行归纳总结。 如果不明确的提取指定表格的内容,而是按照行数据进行读取,让模型根据理解来提取数据,存在数据提取出错的问题。 经过对比发现,存在将A场景的数据赋予到B项的内容里面,造成总结的结论有问题。
如何优雅的解决单篇内容内的幻觉问题?
我的一些实践:
- 文本中的数据,需要使用编程手段做好最准确的提取。在数据的输入环节,确保数据的准确性。
- 利用一定的规则或者小模型对数据进行分类。
- 每种类别,定义好对应的后续处理策略。