louisbrulenaudet/code-transports
收藏Hugging Face2024-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-transports
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Code des transports,专注于法律实践中的微调预训练语言模型,以提高模型在特定任务上的效率和准确性。数据集包含多个任务类别,如文本生成、表格问答、摘要生成、文本检索、问答和文本分类。数据集的大小在1K到10K之间,语言为法语,且是单语言的。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。
该数据集名为Code des transports,专注于法律实践中的微调预训练语言模型,以提高模型在特定任务上的效率和准确性。数据集包含多个任务类别,如文本生成、表格问答、摘要生成、文本检索、问答和文本分类。数据集的大小在1K到10K之间,语言为法语,且是单语言的。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 法语
- 多语言性: 单语种
- 标签: 微调, 法律, 法国法律, 法国法典, 交通法典
- 源数据集: 原始数据
- 美观名称: 交通法典
- 任务类别: 文本生成, 表格问答, 摘要, 文本检索, 问答, 文本分类
- 大小类别: 1K<n<10K
数据集描述
该项目专注于微调预训练语言模型,以创建高效且准确的法律实践模型。微调过程涉及通过在特定任务或领域数据上进一步训练来调整模型的参数。指令式微调利用人类提供的指令来指导模型的行为,这些指令可以是文本提示、带有明确任务描述的提示或两者的组合。
数据集生成
该JSON文件是一个字典列表,每个字典包含以下字段:
instruction: 字符串,表示与元素相关的指令。input: 字符串,表示元素的输入细节。output: 字符串,表示元素的输出信息。start: 字符串,表示文章生效日期。expiration: 字符串,表示文章失效日期。num: 字符串,表示文章的ID。
用于生成数据集的指令列表如下: python instructions = [ "Compose lintégralité de larticle sous forme écrite.", "Écris la totalité du contenu de larticle.", # ... (省略部分指令以保持简洁) "Quelle est la lettre de larticle ?" ]



