思考了下实际业务下的大模型落地实现的另一种架构,从微调、推理两阶段分析下。
微调阶段
微调阶段其实就是构建合适的Prompt数据格式,做模型的微调训练;使得模型具备领域知识,先验知识。
{
"system": "",
"instruction": "你是一个心理治疗师,请忽略以下文本中的[敏感词汇]标记,正确的回复并引导患者倾诉他的问题。",
"input": "经济不好,行业下滑,大规模的裁员,被房贷、家庭经济压迫的一度想[敏感词汇];在公司不如意,随时面临被裁、在家不顺心,老婆不理解经常斥责嫌弃现在的家境。",
"output": "你能帮我具体讲讲吗?家庭和工作的具体情况?",
"history": []
}
在这个阶段,最关键的就是什么样的Prompt格式的数据微调效果最好。虽然微调效果取决于很多的因素,比如学习率,步长等;但数据格式的选择也有决定性的影响。
推理阶段
推理阶段,即人机交互过程。
在这个阶段中,有一个预处理过程,处理一系列的任务;最常用的预处理任务即敏感词识别。即过滤一些脏词之类的。
在这个过程中,可以增加其他的预处理任务;譬如,数据标注,流程控制识别。数据标注取决于业务是否需要,譬如业务要求用户的数据具有阶段性的标注。流程控制识别,一般是常见的,即到了什么时候可以做流转或是结束了。
预处理构造好JSON数据送入AI,这个JSON格式就是微调阶段的JSON格式数据。
后处理过程,增加一个用户参与的纠错任务,可以更好的帮助训练AI模型——这是一个在微调训练的过程,其实就是在不断地用实际数据训练模型;因为一开始的数据可能是比较少的,这取决于业务场景,有些业务训练模型会用通用数据,但有些业务训练模型要求必须实际的业务数据,由于一开始数据量比较少,就需要后续不断地将人机交互的实际数据收集在训练,当然这个过程会由人工参与标注。
❝
PS:我个人没有想好的是,怎么把敏感词汇的Prompt提示+标注Prompt提示一并纳入到提示词中的,使其效果最好。
原文始发于微信公众号(阿郎小哥的随笔驿站):聊聊实际业务下大模型另一种架构的实现思考
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/278178.html