您现在的位置是：首页 > 人工智能人工智能

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

cc博主2023-06-28【人工智能】221人已围观

【CC博客】6月28日消息，幂律智能联合智谱AI发布基于中文千亿大模型的法律垂直大模型——PowerLawGLM。相较于通用大模型的“大而全”，PowerLawGLM聚焦于法律细分领域，针对中文法律场景的应用效果具有独特优势，具备丰富的法律知识和法律语言理解能力。

同时，基于PowerLawGLM大模型的能力，幂律打造了法律对话产品ChatMe，现已正式上线，首批开放50个内测名额。

据介绍，ChatMe的功能和特点包括：

• 合同咨询：ChatMe拥有丰富的合同知识数据，能够回答诸如“合同租期期限”等合同知识问题。

• 合同起草：贴近中文合同起草场景，模版起草、条款组合起草、端对端生成起草等多种解决方案，让生成的合同质量更高。

• 合同信息抽取：能够识别合同中的关键信息进行提取，如主体信息，合同总金额等等。

• 合同审查：能够针对合同条款的风险点给出相关建议，提示风险。

• 通用法律咨询：提供具有专业法律依据的法律咨询服务。

“PowerLawGLM”的打造

通用大模型是具有强大语言理解能力和生成能力的人工智能模型，但由于专业知识及数据的欠缺，将通用大模型直接应用在法律领域，往往存在着严重的效果问题，例如法律知识错误、专业引用偏差、法律体系差异等问题。比如前段时间美国律师使用ChatGPT来提交法庭简报，结果引用的6个案例都是ChatGPT编造的虚假案例，这种“人工智能幻觉”现象在法律场景屡见不鲜，也说明了目前通用大模型难以保证法律专业层面的真实性、正确性。

幂律智能自2017年成立以来即深耕于法律+AI领域，基于领先的法律AI能力，向企业提供智能合同产品，并且深度参与了清华大学自然语言处理实验室的OpenCLaP、LawFormer等法律大模型的研发及应用。

智谱AI作为领先的通用大模型厂商，法律领域是其大模型迭代及布局的重要方向，基于双方达成的战略合作，在法律大模型上展开深度合作，来加快推动大模型在法律行业应用落地及商业化。

据悉，自2023年初双方成立联合项目组，启动法律大模型研发以来，经过千亿规模的基座模型增量训练、对话层监督微调、应用层工程优化，基于中文千亿大模型的法律垂直大模型——PowerLawGLM。

据介绍，PowerLawGLM法律大模型，基于智谱目前效果最好的ChatGLM 130B通用千亿对话大模型进行联合研发。在2022年11月斯坦福大学基础模型中心对全球 30 个大模型的评测结果中，GLM-130B 是亚洲唯一入选的Top10大模型。

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM 第2张

训练法律垂直大模型第一步——基座层：阅读大量法律文本。

通用大模型在法律场景的应用效果问题，最基础的原因在于基座大模型没有经过大量高质量专业法律文本数据的训练。双方基于ChatGLM130B的基座大模型GLM 130B，经过了多轮多次高质量法律文本数据（裁判文书、法律法规、法律知识问答等）清洗及模型增量训练，得到法律版基座大模型LawGLM 130B。

训练法律垂直大模型第二步——对话层：与法律对话场景对齐，具备法律场景的对话能力。

LawGLM 130B基座模型具备了文本生成能力，但在法律对话能力上存在欠缺，因此需要利用大量的法律领域对话数据进行监督微调。双方利用了近百万对高质量法律知识问题数据，来训练得到PowerLawGLM beta版，此时，它已经初步具备了法律场景的端到端生成式对话能力以及独特的回答习惯。

训练法律垂直大模型第三步——应用层：保证输出结果质量和可靠性。

法律问答的很多场景都有其特殊性，对于结果准确性的要求、可解释性的要求较高，直接大模型来端到端生成回答，会面临很多效果问题，例如引用失效法律、杜撰法条案例、与法律人处理逻辑不一致等等。因此幂律设计了一系列通用型及场景特定型的工程化优化方案，来提升法律问答的有法可依和引用法条内容的准确性，最终提升法律问答的专业性和可靠性。

通过以上三层结构，在基座层、对话层、应用层上提升了大模型对法律专业文本的理解、推理与生成能力：

• 理解能力：理解复杂的法律文本，包括各种法律条款、判例、合同和其他法律文件。

• 推理能力：从法律文本中推断出潜在的问题，提供可能的解决方案，或者预测出可能的法律后果。

• 生成能力：回答法律问题，为用户提供咨询，甚至帮助起草法律文件。它还可以进行法律对话，帮助用户理解复杂的法律问题。

“PowerLawGLM”的实际能力

为了测试PowerLawGLM与通用大模型之间的效果对比，幂律的法律团队收集了互联网上法律相关的Top100高频问题，进行了不同模型的效果人工评测，并且从法律专业人员的角度，与ChatGPT等典型的通用大模型进行的效果对比。评测的维度包括：对问题点的把握是否准确、对问题所含信息的分析是否全面准确、答案的操作可行性强弱、答案的法律专业性程度、法律依据有无，以及准确性全面性程度。最终的评测结果显示，100个问题的最优答案中，PowerLawGLM接近70%是最优答案，并且在操作可行性、法律专业性等方面差异显著。

幂律还现场演示了同样一个法律问题，ChatGPT和PowerLawGLM给出的回答：

1.针对某一法律问题的咨询：

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM 第3张
ChatGPT对于彩礼问题的回答