five

louisbrulenaudet/code-mutualite

收藏
Hugging Face2024-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-mutualite
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Code de la mutualité,专注于通过微调预训练语言模型来创建高效且准确的法律实践模型。数据集包含法国法律文本,适用于多种任务,如文本生成、表格问答、摘要、文本检索、问答和文本分类。数据集的生成基于一系列指令,这些指令用于指导模型生成法律文本。每个数据条目包含指令、输入、输出、生效日期、过期日期和文章编号等字段。
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

基本信息

  • 许可证:Apache-2.0
  • 语言:法语
  • 多语言性:单语种
  • 标签:微调、法律、法国法律、法国民法、互助法典
  • 源数据集:原始数据
  • 任务类别:文本生成、表格问答、摘要、文本检索、问答、文本分类
  • 数据集大小:1K<n<10K

数据集描述

  • 数据集名称:互助法典(Code de la mutualité)
  • 描述:该项目专注于微调预训练语言模型,以创建高效且准确的法律实践模型。微调过程涉及通过在特定任务或领域数据上进一步训练来调整模型的参数。指令式微调利用人类提供的指令来指导模型的行为,这些指令可以是文本提示、带有明确任务描述的提示或两者的组合。

数据集生成

  • 数据格式:JSON文件,包含以下字段:
    • instruction:字符串,表示与元素相关的指令。
    • input:字符串,表示元素的输入细节。
    • output:字符串,表示元素的输出信息。
    • start:字符串,表示文章生效日期。
    • expiration:字符串,表示文章失效日期。
    • num:字符串,表示文章的ID。
  • 生成指令:使用了以下指令列表来生成数据集: python instructions = [ "Compose lintégralité de larticle sous forme écrite.", "Écris la totalité du contenu de larticle.", # ... (省略部分指令以保持简洁) "Quelle est la lettre de larticle ?" ]
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作