三月过半的总结
三月份同时在推进多个项目,工作和生活上有点’顾头不顾腚’ 。过多的项目推进失衡,导致心理上有点倦怠感。 回顾一下最近半个月的工作:
- 数据治理双周报总结, 数据集市双周报总结,连续发了两次。
- 大模型项目每周汇报,治理每周也有周报。
- 数据治理工具沟通交流2次。
- 虚拟数字人厂商沟通交流两次。
- 临时增加政信类项目信息汇总的工作,进行初步交流。
- 数据治理的元数据分析(表级和字段级的现状质量评估)
- 全行数据分析师培训准备(平台准备,定期晾晒评估和培训场地选择等)
- 治理工作汇报材料整理。
- 治理委员会季度汇报准备。
- 实习生带教。
- 基于千问大模型的数据标准对标识别原型设计。
- Transformer模型架构的基础技术调研(自学)
工作上的动作太多,有点累!
关于管理的一点反思
团队成员的材料输出质量不足,受累的还是我自己。 每个人撰写材料,优先从自己的知识面和负责场景出发,这在做技术总结类的材料上是不错的,但是如果是面上领导层的汇报,就显得太过于细节和专业化,最终导致鸡同鸭讲,很难从部门层面将汇报的事情讲透。
同步进行的工作太多,有时又顾此失彼。部分任务很难做细粒度的拆分,这导致我最近非常的受累。分解任务,并制定具体的工作要求,限期完成,中间还要跟进,防止跑偏,这部分管理工作我是没有做到位。另外一方面,作为企业的中层管理者,既要满足不同领导的上级需求,又要兼顾项目的进度和管理。实在在夹心饼干中最累的一个群体。
关于技术追求
周末和晚间还是在看大模型结构原理的视频材料。生命不止,学习也不止。近期追完了NLP的RNN,LSTM以及Embeddings模型的基本原理和优缺点。 下周要完成Transformer的Position Encoding, MultiHeadAttention机制的原理学习。掌握基础原理来保障后续涉及大模型的论文或专利的创新点的思考。
利用大模型,学习的效率也是明显的有提升。对于疑问点, 通常ChatGPT能给予较为清晰的讲解,甚至还能基于这些讲解直接构建一些代码样例。
下周的几个技术研究的重点:
- 原理层面:了解Position Encoding, MultiHeadAttention机制。
- 技术应用层面:了解如何精细化的切分文本并标记Label用于精准的RAG内容搜索和识别(客户画像和风险报告生成领域)
写在后面
坚持技术积累,每周都要有技术总结,相信知识和技术可以改变命运!