five

louisbrulenaudet/code-minier-nouveau

收藏
Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-minier-nouveau
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专注于对预训练语言模型进行微调,以创建高效且准确的模型用于法律实践。它特别关注法国法律,尤其是‘新矿产法典’,并用于文本生成、问答和分类等多种NLP任务。数据集通过指令引导的微调方法,利用人类提供的指令来指导模型的行为,从而提高模型在特定任务上的适应性和性能。此外,数据集的结构和生成过程也在README中详细说明,包括JSON文件的格式和用于生成数据的指令列表。

该数据集专注于对预训练语言模型进行微调,以创建高效且准确的模型用于法律实践。它特别关注法国法律,尤其是‘新矿产法典’,并用于文本生成、问答和分类等多种NLP任务。数据集通过指令引导的微调方法,利用人类提供的指令来指导模型的行为,从而提高模型在特定任务上的适应性和性能。此外,数据集的结构和生成过程也在README中详细说明,包括JSON文件的格式和用于生成数据的指令列表。
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 法语
  • 多语言性: 单语种
  • 标签:
    • 微调
    • 法律
    • 法国法律
    • 法国法
    • 新矿业法典
  • 源数据集: 原始数据
  • 美观名称: 新矿业法典

任务类别

  • 文本生成
  • 表格问题回答
  • 摘要
  • 文本检索
  • 问答
  • 文本分类

大小类别

  • 数据集大小: 1K<n<10K

数据集生成

  • 数据集由一系列JSON文件组成,每个文件包含多个字典,每个字典包含以下字段:
    • instruction: 字符串,与元素相关的指令。
    • input: 字符串,元素的输入细节。
    • output: 字符串,元素的输出信息。
    • start: 字符串,文章生效日期。
    • expiration: 字符串,文章失效日期。
    • num: 字符串,文章的ID。

数据集使用说明

  • 数据集主要用于微调预训练语言模型,以创建适用于法律实践的高效准确模型。
  • 微调过程涉及在特定任务或领域数据上进一步训练模型参数,使用指令引导模型行为,提高模型在特定任务上的适应性和性能。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作