大模型的数据准备工作总结

数据预处理工作的经验总结

近期接手了一个任务:使用大模型对客户进行画像总结。这个任务涉及多方面的数据汇总和加工处理工作。

  1. 客户在行内的的金融产品信息,覆盖申请、提款、逾期等
  2. 客户的企业基本信息
  3. 客户的个人征信信息
  4. 企业的征信信息
  5. 外部信息(如企查查信息)
  6. 短信、电话记录等
<...
Read More
大模型提示词工程遇到的问题 - 幻觉

提示词工程构建过程中遇到的幻觉问题

最近两天使用千问14B模型,构建客户信息的总结摘要。在这个过程中,要求将word文档中的结构化数据(表格),进行归纳总结。 如果不明确的提取指定表格的内容,而是按照行数据进行读取,让模型根据理解来提取数据,存在数据提取出错的问题。 经过对比发现,存在将A场景的数据赋予到B项的内容里面,造成总结的结论有问题。

如何优雅的解决单篇内容内的幻觉问题?

我的一些实践......

Read More
CodeShell大模型训练交流总结

CodeShell交流活动总结速记

CodeShell 参会总结

四川天府银行成立于2001年。现有员工2043人,下设10家省内外分行、119家营业机构;设立4家村镇银行、1家贷款公司、1家金租公司。该公司于2023年4月份开始和北京大学知识计算实验室叶蔚教授合作,开展多语言代码大模型基座研究工作。目前发布了CodeShell-7B代码大模型。CodeShell具有70亿参数,在五千亿Tokens进行......

Read More
Prompt使用总结

提示词工程实践总结 - 像写代码一样写提示词

近期在尝试使用提示词来实现一个周报摘要的生成。在处理过程中,不同的提示词带来的效果区分明显。 本次博客记录Prompt的优化总结。

Prompt使用原则

基本原则:

  1. 编写清晰具体的指令
  2. 给模型充足的思考时间

编写清晰具体的指令:

避免提......

Read More
  • 1
  • 2