louisbrulenaudet/code-impots
收藏Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-impots
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Code général des impôts,主要用于法律领域的微调预训练语言模型,以提高模型在法律实践中的效率和准确性。数据集包含法语文本,涉及的任务类别包括文本生成、表格问答、摘要、文本检索、问答和文本分类。数据集的规模在1K到10K之间。数据集通过基于指令的微调方法进行优化,强调了其在任务特定适应、减少歧义、高效知识转移、可解释性和自适应行为方面的优势。数据集的生成过程包括每个数据项的字段(如指令、输入、输出、生效日期、过期日期和文章编号)以及用于生成数据集的指令列表。
The dataset, named Code général des impôts, is primarily used for fine-tuning pre-trained language models in the legal domain to enhance their efficiency and accuracy in legal practice. The dataset contains French text and covers task categories such as text generation, table question answering, summarization, text retrieval, question answering, and text classification. The dataset size ranges between 1K and 10K. The dataset is optimized using instruction-based fine-tuning, emphasizing its advantages in task-specific adaptation, reduced ambiguity, efficient knowledge transfer, interpretability, and adaptive behavior. The dataset generation process includes fields for each data item (such as instruction, input, output, start date, expiration date, and article number) and a list of instructions used for generating the dataset.
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 法语
- 多语言性: 单语种
- 标签:
- 微调
- 法律
- 法国法律
- 法国税法总则
- 来源数据集: 原始数据
- 美观名称: 法国税法总则
- 任务类别:
- 文本生成
- 表格问题回答
- 摘要生成
- 文本检索
- 问答
- 文本分类
- 大小类别: 1K<n<10K
数据集内容
- 数据集生成: 数据集由JSON文件组成,每个字典包含以下字段:
instruction: 字符串,与元素相关的指令。input: 字符串,元素的输入细节。output: 字符串,元素的输出信息。start: 字符串,文章生效日期。expiration: 字符串,文章失效日期。num: 字符串,文章ID。
使用说明
- 微调方法: 本项目专注于通过微调预训练语言模型,创建适用于法律实践的高效准确模型。微调过程涉及在特定任务或领域数据上进一步训练模型参数,采用指令基础的微调方法,通过人类提供的指令引导模型行为,提高模型在特定任务上的表现和可解释性。



