科研成果展示



夫子•明察司法大模型


夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,基于海量中文无监督司法语料(包括各类判决文书、法律法规等)与有监督司法微调数据(包括法律问答、类案检索)训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答服务。

项目地址:https://github.com/irlab-sdu/fuzi.mingcha

内测申请:https://docs.qq.com/form/page/DVkdpdWFkbGNBWklk

三大特色

  • 一、基于法条检索回复

  • 夫子•明察大模型能够结合相关法条进行回复生成。对于用户的咨询,夫子•明察大模型基于生成式检索范式先初步引用相关法条,再检索外部知识库对所引法条进行校验与确认,最终结合这些法条进行问题分析与回复生成。这保证生成的回复能够基于与问题相关的法律依据,并根据这些依据提供深入的分析和建议,使回复具有高权威性、高可靠性与高可信性。

    基于法条检索回复案例:

    夫子•明察首先能够准确地找出公司法相关的法律法规,并结合其总结出用户所需要的文件,增强其回复的可验证性。

    图:基于法条检索回复案例1

    对于用户比较简短的提问,夫子•明察也能准确的找到所对应的法条,即个人独资企业法中关于申请登记的相关规定。

    图:基于法条检索回复案例2

    夫子•明察可以准确的输出关于假冒专利的相关法律法规,并以此回答用户的问题,增强了模型的可靠性。

    图:基于法条检索回复案例3



  • 二、基于案例检索回复

  • 夫子•明察大模型能够基于历史相似案例对输入案情进行分析。大模型能够生成与用户提供的案情相似的案情描述及判决结果,通过检索外部数据库得到真实的历史案例,并将这些相似的历史案例的信息用于辅助生成判决。生成的判决参考相关案例的法律依据,从而更加合理。用户可以对照相似案例,从而更好地理解潜在的法律风险。

    基于案例检索回复案例:

    在基于案例检索回复功能中,夫子•明察大模型能够依据输入的案情信息生成相应的案例,并检索相似案例辅助判决生成。

    图:基于案例检索回复案例1

    图:基于案例检索回复案例2

    图:基于案例检索回复案例3



  • 三、三段论推理判决

  • 司法三段论,是把三段论的逻辑推理应用于司法实践的一种思维方式和方法。类比于三段论的结构特征,司法三段论就是法官在司法过程中将法律规范作为大前提,以案件事实为小前提,最终得出判决结果的一种推导方法。针对具体案件,夫子•明察大模型系统能够自动分析案情,识别关键的事实和法律法规,生成一个逻辑严谨的三段论式判决预测。这个功能不仅提供了对案件可能结果的有力洞察,还有助于帮助用户更好地理解案件的法律依据和潜在风险。

    三段论推理判决案例:

    夫子•明察可以输出法条作为大前提,各种犯罪要件等作为小前提,得到判决结果作为结论。

    图:三段论推理判决案例



训练细节

  • 一、 数据组成
  • 夫子•明察司法大模型的训练数据可分为两大类别:中文无监督司法语料以及有监督司法微调数据。其中不仅涵盖法律法规、司法解释、判决文书等内容,同时还包括各类高质量司法任务数据集,例如法律问答、类案检索和三段论式法律判决。内容丰富、优质海量的训练数据,确保了对司法领域知识进行准确且全面的覆盖,为夫子•明察司法大模型提供坚实的知识基础。

    ✓ 中文无监督司法语料约2000万条(包括法律法规、判决文书等)

    ✓ 中文有监督司法微调数据约20万条(包括自主构建的三段论格式的法律判决数据和类案检索数据等)

  • 二、 训练过程
  • 夫子•明察大模型的训练过程分为两个关键阶段:大规模司法语料的增量预训练和基于高质量司法数据的模型微调。

    第一阶段,使用大规模司法语料,对ChatGLM基座大模型进行增量预训练。针对司法领域,使用约 2000万条判决文书和法律法规等司法语料(共约400亿token),对夫子•明察大模型进一步增量预训练,使模型获得在法律领域的基础理解能力。

    第二阶段,利用有标注司法数据,对夫子•明察大模型进行微调。针对司法领域,使用近20万条高质量司法任务数据来增强模型领域指令遵循的能力。为了防止模型遗忘通用指令遵循能力,微调数据中引入通用领域指令微调数据。通过全量微调,夫子•明察大模型在下游法律任务上的表现显著提升。

    值得一提的是,夫子•明察司法大模型是基于山东大学信息检索实验室自主研发的基础大模型平台——AIzoo训练而成。AIzoo是一个开放、自主、可控的多学科融合人工智能支撑平台,包含可视化、机器学习、深度学习、自然语言处理模块、图像处理模块等前沿技术,可用于实验设计,模型设计和指标测评等科研活动,能够面向各行业各领域的开展具体应用。实现产、学、研 、用一体化发展。

    图:AIzoo基础大模型平台

    图:夫子•明察大模型训练任务流


多模型对比

夫子•明察在大量法律判决数据上进行了训练,因此擅长司法判决、案情分析,其他任务如法律咨询、司法考试尽管数据量偏小,但也能有不错的表现。

我们通过对不同法律模型进行测试样例比对,来展示夫子•明察在其他任务和数据上的表现。

  • 一、 法律咨询
  • 询问:政府公务员可以成为企业合伙人吗

    表 法律咨询各模型回复对比
    模型 回复
    夫子•明察(模型直接回复) 政府公务员不能成为企业合伙人,因为政府公务员的职责是为人民服务,而不是为自己谋取利益。在企业合伙过程中,政府公务员不能利用自己的职权和影响力来干预企业的经营管理,也不能参与企业的利润分配。如果政府公务员想要成为企业合伙人,需要符合相关法律法规的规定,取得相应的资格和条件。
    夫子•明察(经过法条检索) 不可以。根据《中华人民共和国合伙企业法》第九条规定,申请设立合伙企业时,应当向企业登记机关提交登记申请书、合伙协议书、合伙人身份证明等文件。其中,合伙人为国家机关工作人员的,应当提交其职务证明文件,并注明其委派代表的职务。因此,政府公务员不能成为企业合伙人。
    其他法律模型 根据《中华人民共和国公务员法》第X条规定,公务员离开原任职务后,可以在一定期限内从事与原任职务有关的工作,但不得利用原任职务或者职权从事营利活动。因此,政府公务员可以成为企业合伙人,但必须符合上述规定,不能利用原任职务或职权从事营利活动。
    ChatGLM 公务员不可以成为企业合伙人,因为公务员身份和职业责任不允许从事营利性活动,包括成为企业合伙人。 根据《公务员法》的规定,公务员必须履行工作职责,同时遵守职业道德和职业操守,不得从事与工作无关的活动,也不得利用职务之便谋取私利。公务员之间也不得建立商业关系或者成为合伙人。 公务员成为企业合伙人可能会违反法律法规,不仅会影响公务员的形象和信誉,也会损害政府的公信力和形象。因此,政府公务员不得成为企业合伙人。

    在没有进行法条检索时,夫子•明察本身具有了相关法律的知识,并能作出准确的回复。在经过法条检索后,夫子·明察的回复更加完整,并标注了准确且最新的相关法条。

  • 二、 案例分析
  • 询问:分析案例:徐某(男)与李某(女)婚后育有一子(1岁半)、一女(8岁),两人准备离婚,都想争取孩子抚养权。徐某经济状况较好,工资收入是李某的数倍,认为自己胜券在握。李某虽收入不高,但女儿更愿意随其生活。

    表 案例分析1各模型回复对比
    模型 回复
    夫子•明察 根据《民法典》第一千零八十四条规定,离婚后,子女无论由父或母直接抚养,仍是父母双方的子女。离婚后,父母对于子女仍有抚养、教育、保护的权利和义务。根据《民法典》第一千零八十五条规定,离婚后,子女由一方直接抚养的,另一方应当负担部分或全部抚养费。负担费用的多少和期限的长短,由双方协议;协议不成的,由人民法院判决。 根据《民法典》第一千零八十六条规定,离婚后,不直接抚养子女的父或母,有探望子女的权利,另一方有协助的义务。行使探望权利的方式、时间由当事人协议;协议不成的,由人民法院判决。 在本案中,徐某与李某都想争取孩子抚养权,应当根据最有利于未成年子女的原则依法判决。如果双方不能达成协议,应当由人民法院依照相关规定进行判决。此外,由于女儿还在上学,生活费用和抚养费用可能会增加,应当根据实际情况进行适当的调整。
    其他法律模型 根据《中华人民共和国婚姻法》的规定,子女抚养权的判决应当以未成年子女的利益为出发点,综合考虑父母的经济条件、身体情况、家庭环境等情况,最终确定抚养人。因此,在本案中,法院会综合考虑双方的经济能力、工作时间、居住环境等因素来判断抚养权归属问题。 首先,徐某的经济条件好,收入水平较高,可以为孩子的成长提供更好的物质条件。但是,如果李某能够证明自己有更好的照顾孩子的能力,或者孩子的身心健康需要由她来照顾,那么她也有可能获得抚养权。其次,女儿年龄较大,已经八岁,对于她的意愿也应该有所考虑。如果女儿表示愿意随母亲生活,法院也会考虑到这一因素。 综上所述,在本案中,法院会综合考虑双方的经济能力、照顾孩子的能力、女儿的意愿等因素来判决抚养权归属问题。建议双方积极沟通协商,尽量达成一致意见,并在法律程序中维护自己的合法权益。
    ChatGLM 这个案例涉及到孩子抚养权的问题,需要考虑多个因素来做出决定。以下是一些分析和建议: 1. 孩子的年龄和需求:孩子在不同的年龄段有不同的需求和特点。1岁半的孩子通常需要关注他们的日常生活,如饮食、睡眠、安全等。8岁的孩子已经进入了青春期,需要更多的关 注和支持,以帮助他们发展社交技能和情感健康。因此,抚养权的归属需要考虑孩子的需求和年龄。 ... 综合以上因素,如果徐某的经济状况更好,并且孩子更愿意跟李某生活,那么李某可能会获得孩子的抚养权。但最终结果还需要根据法律程序来裁决,因此,建议双方在法律框架内进行沟通和协商,以达成一个最好的解决方案。

    尽管夫子•明察并没有在案情分析数据集上进行训练,但也表现出了不错的分析能力。语言风格上其他法律模型会更加自然、口语化,回复格式统一。


    询问:21 岁女子甲与25 岁男子乙在网上聊天后产生好感,乙将甲发给其的私密照片保存。后乙要求与甲结婚,甲不同意。乙威胁要公布其照片,甲只好同意结婚并办理了登记。甲是否可以自婚姻登记之日起 1年内请求撤销该婚姻?

    表 案例分析2各模型回复对比
    模型 回复
    夫子•明察 根据《民法典》第一千零五十二条规定,如果甲因胁迫结婚,可以在结婚登记之日起一年内请求撤销婚姻。而根据《民法典》第一千零五十三条规定,如果乙在甲办理结婚登记前泄露甲的私密照片,会对甲造成精神上的伤害,也会对甲的撤销请求权产生影响。因此,如果乙在甲办理结婚登记前泄露甲的私密照片,甲可以向人民法院请求撤销婚姻。但需要注意的是,请求撤销婚姻的,应当自胁迫行为终止之日起一年内提出。如果甲被乙威胁要公布其照片,甲也可以在结婚登记之日起一年内请求撤销该婚姻。
    其他法律模型 依据《民法典》第一千零五十二条规定,因胁迫结婚的,受胁迫的一方可以向人民法院请求撤销婚姻。因此,如果甲是在受到胁迫的情况下同意结婚的,那么甲可以在自婚姻登记之日起一年内向人民法院请求撤销婚姻。但是,需要进一步了解的是,是否存在胁迫的情况,以及胁迫的方式和手段等。 另外,根据《民法典》第一千零四十六条规定,结婚应当男女双方完全自愿,禁止任何一方对另一方加以强迫,禁止任何组织或者个人加以干涉。如果甲是在完全自愿的情况下同意结婚的,那么甲无法请求撤销婚姻。 综上所述,需要进一步了解甲同意结婚的具体情况,以及是否存在胁迫的情况。建议甲咨询专业律师,寻求专业的法律帮助。
    ChatGLM 根据中国《婚姻法》的规定,婚姻关系是自婚姻开始时即存在的,非经法定程序而不能消灭。婚姻无效的原因有:(一)重婚的;(二)有禁止结婚的疾病而结婚无效的;(三)因胁迫而结婚无效的;(四)自始没有感情而结婚无效的;(五)因欺诈而结婚无效的。婚姻无效、可依法撤销。甲可以自婚姻登记之日起 1 年内向当地人民法院提起撤销婚姻的诉讼。

    尽管夫子•明察并没有在民法相关的案情分析数据上进行训练,但同样表现出不错的泛化性。

结语

夫子•明察司法大模型的诞生不仅优化了法律咨询和解答服务的精准度,也预示着未来更智能、更人性化的法律服务体系的开展。我们坚信夫子•明察将不断创新,引领法律服务行业向更高层次迈进。