近期接手了一个任务:使用大模型对客户进行画像总结。这个任务涉及多方面的数据汇总和加工处理工作。
- 客户在行内的的金融产品信息,覆盖申请、提款、逾期等
- 客户的企业基本信息
- 客户的个人征信信息
- 企业的征信信息
- 外部信息(如企查查信息)
- 短信、电话记录等
数据预处理工作的经验总结
近期接手了一个任务:使用大模型对客户进行画像总结。这个任务涉及多方面的数据汇总和加工处理工作。
提示词工程构建过程中遇到的幻觉问题
最近两天使用千问14B模型,构建客户信息的总结摘要。在这个过程中,要求将word文档中的结构化数据(表格),进行归纳总结。 如果不明确的提取指定表格的内容,而是按照行数据进行读取,让模型根据理解来提取数据,存在数据提取出错的问题。 经过对比发现,存在将A场景的数据赋予到B项的内容里面,造成总结的结论有问题。
如何优雅的解决单篇内容内的幻觉问题?
我的一些实践......
Read MoreCodeShell交流活动总结速记
四川天府银行成立于2001年。现有员工2043人,下设10家省内外分行、119家营业机构;设立4家村镇银行、1家贷款公司、1家金租公司。该公司于2023年4月份开始和北京大学知识计算实验室叶蔚教授合作,开展多语言代码大模型基座研究工作。目前发布了CodeShell-7B代码大模型。CodeShell具有70亿参数,在五千亿Tokens进行......
Read More提示词工程实践总结 - 像写代码一样写提示词
近期在尝试使用提示词来实现一个周报摘要的生成。在处理过程中,不同的提示词带来的效果区分明显。 本次博客记录Prompt的优化总结。
基本原则:
编写清晰具体的指令:
避免提......
Read More