大模型的数据准备工作总结

Tue 09 January 2024 • LLM •

数据预处理工作的经验总结

近期接手了一个任务：使用大模型对客户进行画像总结。这个任务涉及多方面的数据汇总和加工处理工作。

客户在行内的的金融产品信息，覆盖申请、提款、逾期等
客户的企业基本信息
客户的个人征信信息
企业的征信信息
外部信息（如企查查信息）
短信、电话记录等

<...

大模型提示词工程遇到的问题 - 幻觉

Wed 03 January 2024 • LLM •

提示词工程构建过程中遇到的幻觉问题

最近两天使用千问14B模型，构建客户信息的总结摘要。在这个过程中，要求将word文档中的结构化数据（表格），进行归纳总结。如果不明确的提取指定表格的内容，而是按照行数据进行读取，让模型根据理解来提取数据，存在数据提取出错的问题。经过对比发现，存在将A场景的数据赋予到B项的内容里面，造成总结的结论有问题。

如何优雅的解决单篇内容内的幻觉问题？

我的一些实践......

CodeShell大模型训练交流总结

Tue 26 December 2023 • LLM •

CodeShell交流活动总结速记

CodeShell 参会总结

四川天府银行成立于2001年。现有员工2043人，下设10家省内外分行、119家营业机构；设立4家村镇银行、1家贷款公司、1家金租公司。该公司于2023年4月份开始和北京大学知识计算实验室叶蔚教授合作，开展多语言代码大模型基座研究工作。目前发布了CodeShell-7B代码大模型。CodeShell具有70亿参数，在五千亿Tokens进行......

Prompt使用总结

Tue 05 December 2023 • LLM •

提示词工程实践总结 - 像写代码一样写提示词

近期在尝试使用提示词来实现一个周报摘要的生成。在处理过程中，不同的提示词带来的效果区分明显。本次博客记录Prompt的优化总结。

Prompt使用原则

基本原则：

编写清晰具体的指令
给模型充足的思考时间

编写清晰具体的指令:

避免提......

CodeShell 参会总结

Prompt使用原则

Receive Updates

Contacts