louisbrulenaudet/code-minier
收藏Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-minier
下载链接
链接失效反馈官方服务:
资源简介:
Code minier数据集专注于微调预训练语言模型,以创建适用于法律实践的高效和准确模型。该数据集包含法律领域的文本生成、表格问答、摘要、文本检索、问答和文本分类等任务。数据集的大小在1K到10K之间,语言为法语,且为单语言数据集。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。
Code minier数据集专注于微调预训练语言模型,以创建适用于法律实践的高效和准确模型。该数据集包含法律领域的文本生成、表格问答、摘要、文本检索、问答和文本分类等任务。数据集的大小在1K到10K之间,语言为法语,且为单语言数据集。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
名称: Code minier
许可证: Apache-2.0
语言: 法语(fr)
多语言性: 单语种
标签:
- 微调
- 法律
- 法国法律
- 法国矿业法
源数据集: 原始数据
任务类别:
- 文本生成
- 表格问答
- 摘要
- 文本检索
- 问答
- 文本分类
大小类别: 1K<n<10K
数据集生成:
- 数据集由一系列JSON格式的字典组成,每个字典包含以下字段:
instruction: 字符串,与元素相关的指令。input: 字符串,元素的输入详情。output: 字符串,元素的输出信息。start: 字符串,文章生效日期。expiration: 字符串,文章失效日期。num: 字符串,文章ID。
生成指令:
- 数据集生成使用了多种指令,主要涉及完整撰写文章的指令,如“Compose lintégralité de larticle sous forme écrite.”等。



