louisbrulenaudet/code-commerce
收藏Hugging Face2024-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-commerce
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专注于微调预训练的语言模型,以创建适用于法律实践的高效和准确的模型。数据集基于法国商法(Code de commerce),包含多个任务类别,如文本生成、表格问答、摘要生成、文本检索、问答和文本分类。数据集的大小在1K到10K之间,语言为法语。数据集的生成过程基于一系列指令,每个数据条目包含指令、输入、输出、生效日期、过期日期和文章编号等字段。
This dataset focuses on fine-tuning pre-trained language models to create efficient and accurate models for legal practice. The dataset is based on the French Commercial Code (Code de commerce) and includes multiple task categories such as text generation, table question answering, summarization, text retrieval, question answering, and text classification. The dataset size ranges between 1K and 10K, and the language is French. The dataset generation process is based on a series of instructions, and each data entry contains fields such as instruction, input, output, start date, expiration date, and article number.
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
基本信息
- 许可证: Apache 2.0
- 语言: 法语
- 多语言性: 单语种
- 标签: 微调, 法律, 法国法律, 法国商法, 商法典
- 源数据集: 原始数据
- 数据集名称: 商法典
- 任务类别: 文本生成, 表格问答, 摘要, 文本检索, 问答, 文本分类
- 数据集大小: 1K<n<10K
数据集生成
-
字段:
instruction: 字符串,表示与元素相关的指令。input: 字符串,表示元素的输入细节。output: 字符串,表示元素的输出信息。start: 字符串,表示文章生效日期。expiration: 字符串,表示文章失效日期。num: 字符串,表示文章的ID。
-
生成指令:
- 包含多种法语指令,用于生成数据集中的文章内容。



