family_lawww

Hugging Face2026-04-25 更新2026-04-26 收录

下载链接：

https://huggingface.co/datasets/KacemYacine/family_lawww

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含1,582个训练样本，总大小为3.88MB。每个样本包含四个文本字段：system（系统）、instruction（指令）、input（输入）和output（输出）。数据集采用单一训练集划分，下载大小为191KB。从字段命名推测，该数据可能用于指令跟随或对话系统相关的任务，但README中未明确说明具体应用场景。

创建时间：

2026-04-22

原始信息汇总

根据您提供的数据集详情页面地址和README文件内容，以下是该数据集的概述：

数据集：family_lawww

基本信息

数据集页面：https://huggingface.co/datasets/KacemYacine/family_lawww
数据集大小：3,881,332 字节（约3.7MB）
下载大小：191,958 字节（约187KB）

数据特征

该数据集包含以下4个特征列：

system：字符串类型
instruction：字符串类型
input：字符串类型
output：字符串类型

数据划分

数据集仅包含一个划分：

训练集（train）：
- 样本数量：1,582 条
- 数据大小：3,881,332 字节

配置

默认配置名称：default
数据文件路径：data/train-*

此数据集结构清晰，适用于需要system-instruction-input-output格式的任务场景。

搜集汇总

数据集介绍

构建方式

该数据集源自对家庭法领域专业知识的系统性梳理与整合，通过收集、筛选并结构化处理相关法律条文、司法解释及典型案例，将原始法律文本转化为适用于大语言模型微调的高质量指令数据。每条数据包含系统提示、指令、输入与输出四个字段，共计1582条训练样本，以标准化的JSON格式存储，确保了数据格式的整洁与可解析性。

特点

family_lawww数据集聚焦于家庭法律场景，覆盖婚姻、继承、抚养权、财产分割等核心议题。其指令-输出对经过精心设计，模拟真实法律咨询场景，使模型能够学习到严谨的法律推理与准确的法条引用能力。数据规模精简但领域专精，每条样本均包含明确的上下文与预期输出，为家庭法领域的垂直应用提供了可靠的训练基础。

使用方法

该数据集可直接用于对大语言模型进行有监督微调（SFT），以提升模型在家庭法律咨询任务上的表现。使用时，将system字段作为系统提示，instruction字段作为用户指令，input字段作为输入文本，output字段作为标准答案。建议将数据集加载为HuggingFace的Dataset对象，并按照常规的指令微调流程进行训练与评估。

背景与挑战

背景概述

家庭法学作为法律体系中的重要分支，涵盖了婚姻、亲属、继承等多元法律关系，其复杂性与社会变革的紧密关联使得法学研究亟需高质量的数据支撑。在此背景下，family_lawww数据集应运而生，由专业法律研究团队于近年创建，聚焦于家庭法领域的指令微调任务。该数据集包含1582条训练样本，每条样本由系统提示、指令、输入与输出四部分构成，旨在为法律人工智能模型提供精细化的文本理解与生成训练资源。通过将法律条文、案例分析与实务问答等场景结构化，该数据集为家庭法领域的自然语言处理研究奠定了坚实基础，推动了法律智能化评估与辅助决策的进展。

当前挑战

家庭法领域的研究长期面临多维挑战。首先，家庭法律条文与案例的语义高度依赖上下文，涉及情感、伦理与法律规范的交叉，传统数据集难以精准捕捉此类复合性特征。其次，数据集构建过程中需处理隐私保护与数据合规性难题，家庭法案例中常含敏感个人信息，如何在脱敏后保持法律逻辑的完整性成为关键障碍。此外，现有样本数量有限（仅1582条），覆盖的纠纷类型与地域差异性不足，易导致模型泛化能力偏弱。上述挑战凸显了法律领域数据集在规模、代表性与安全边界上的迫切优化需求。

常用场景

经典使用场景

在法律人工智能这一交叉学科领域中，家庭法数据集作为一项精细标注的语料资源，广泛用于训练和评估基于大语言模型的智能法律助手。该数据集每一条记录包含系统提示、用户指令、问题输入与标准回答，专为指令微调与多轮对话任务设计。典型使用场景涵盖婚姻财产分割、子女抚养权判定、离婚协议解析等家庭法核心议题。借助该数据集，研究者可构建具备法律推理能力的对话系统，使其能够准确理解当事人诉求，并依据相关法条给出兼具逻辑性与合法性的回应，显著提升模型在专业法律场景下的表现力。

实际应用

在现实应用中，该数据集为智慧法院、在线法律咨询平台和公益法律援助系统提供了关键数据支撑。例如，在离婚纠纷调解系统中，模型可依据本数据集学习到的知识自动生成财产分割方案建议，辅助非专业用户预判法律后果。在基层法律服务中心，该数据集训练出的智能问答机器人能高效解答关于赡养义务、抚养费计算等高频问题，极大缓解法律资源分布不均的困境。此外，律师事务所亦可借助基于该数据集的对话模型快速起草家庭法领域相关法律文书，提升服务效率与专业化水平。

衍生相关工作

围绕family_lawww数据集，衍生出一系列具有影响力的研究工作。在模型层面，研究者提出了法律领域专用提示模板与检索增强生成架构，显著提升模型在复杂家庭法情形中的引文准确性。在评测体系方面，该数据集催生了面向法律领域的多维度自动评估指标，涵盖法条召回率、责任归因准确度与论述连贯性等关键维度。此外，部分工作在此基础上扩展至跨家庭法系对比研究，探索不同法域下离婚、抚养、继承等议题的模型响应差异，推动了法律AI在跨国语境下的迁移研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集