five

louisbrulenaudet/code-minier

收藏
Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-minier
下载链接
链接失效反馈
官方服务:
资源简介:
Code minier数据集专注于微调预训练语言模型,以创建适用于法律实践的高效和准确模型。该数据集包含法律领域的文本生成、表格问答、摘要、文本检索、问答和文本分类等任务。数据集的大小在1K到10K之间,语言为法语,且为单语言数据集。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。

Code minier数据集专注于微调预训练语言模型,以创建适用于法律实践的高效和准确模型。该数据集包含法律领域的文本生成、表格问答、摘要、文本检索、问答和文本分类等任务。数据集的大小在1K到10K之间,语言为法语,且为单语言数据集。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

名称: Code minier

许可证: Apache-2.0

语言: 法语(fr)

多语言性: 单语种

标签:

  • 微调
  • 法律
  • 法国法律
  • 法国矿业法

源数据集: 原始数据

任务类别:

  • 文本生成
  • 表格问答
  • 摘要
  • 文本检索
  • 问答
  • 文本分类

大小类别: 1K<n<10K

数据集生成:

  • 数据集由一系列JSON格式的字典组成,每个字典包含以下字段:
    • instruction: 字符串,与元素相关的指令。
    • input: 字符串,元素的输入详情。
    • output: 字符串,元素的输出信息。
    • start: 字符串,文章生效日期。
    • expiration: 字符串,文章失效日期。
    • num: 字符串,文章ID。

生成指令:

  • 数据集生成使用了多种指令,主要涉及完整撰写文章的指令,如“Compose lintégralité de larticle sous forme écrite.”等。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作