louisbrulenaudet/code-minier-nouveau
收藏Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-minier-nouveau
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专注于对预训练语言模型进行微调,以创建高效且准确的模型用于法律实践。它特别关注法国法律,尤其是‘新矿产法典’,并用于文本生成、问答和分类等多种NLP任务。数据集通过指令引导的微调方法,利用人类提供的指令来指导模型的行为,从而提高模型在特定任务上的适应性和性能。此外,数据集的结构和生成过程也在README中详细说明,包括JSON文件的格式和用于生成数据的指令列表。
该数据集专注于对预训练语言模型进行微调,以创建高效且准确的模型用于法律实践。它特别关注法国法律,尤其是‘新矿产法典’,并用于文本生成、问答和分类等多种NLP任务。数据集通过指令引导的微调方法,利用人类提供的指令来指导模型的行为,从而提高模型在特定任务上的适应性和性能。此外,数据集的结构和生成过程也在README中详细说明,包括JSON文件的格式和用于生成数据的指令列表。
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 法语
- 多语言性: 单语种
- 标签:
- 微调
- 法律
- 法国法律
- 法国法
- 新矿业法典
- 源数据集: 原始数据
- 美观名称: 新矿业法典
任务类别
- 文本生成
- 表格问题回答
- 摘要
- 文本检索
- 问答
- 文本分类
大小类别
- 数据集大小: 1K<n<10K
数据集生成
- 数据集由一系列JSON文件组成,每个文件包含多个字典,每个字典包含以下字段:
instruction: 字符串,与元素相关的指令。input: 字符串,元素的输入细节。output: 字符串,元素的输出信息。start: 字符串,文章生效日期。expiration: 字符串,文章失效日期。num: 字符串,文章的ID。
数据集使用说明
- 数据集主要用于微调预训练语言模型,以创建适用于法律实践的高效准确模型。
- 微调过程涉及在特定任务或领域数据上进一步训练模型参数,使用指令引导模型行为,提高模型在特定任务上的适应性和性能。



