five

louisbrulenaudet/code-securite-sociale

收藏
Hugging Face2024-07-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-securite-sociale
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Code de la sécurité sociale, non-instruct (2024-07-21),专注于通过微调预训练语言模型来创建高效且准确的法律实践模型。数据集的内容基于法国社会保障法典(Code de la sécurité sociale),并提供了多种任务类别,如文本生成、表格问答、摘要生成等。数据集的生成方式是通过指令微调(instruction-based fine-tuning),使用了一系列的指令来生成数据集的内容。数据集的结构为JSON格式,每个条目包含指令、输入、输出、生效日期、过期日期和文章编号等信息。

The dataset, named Code de la sécurité sociale, non-instruct (2024-07-21), focuses on fine-tuning pre-trained language models to create efficient and accurate models for legal practice. The content of the dataset is based on the French Social Security Code (Code de la sécurité sociale) and provides multiple task categories such as text generation, table question answering, summarization, etc. The dataset is generated through instruction-based fine-tuning, using a series of instructions to generate the content. The dataset is structured in JSON format, with each entry containing fields such as instruction, input, output, start date, expiration date, and article number.
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

基本信息

  • 许可证:Apache 2.0
  • 语言:法语
  • 多语言性:单语种
  • 标签:微调、法律、法国法律、法国社会保障法典
  • 源数据集:原始数据
  • 任务类别:文本生成、表格问答、摘要、文本检索、问答、文本分类
  • 数据集大小:1K<n<10K

数据集描述

  • 名称:Code de la sécurité sociale
  • 描述:该项目专注于微调预训练语言模型,以创建高效且准确的法律实践模型。微调过程涉及通过在特定任务或领域数据上的进一步训练来调整模型的参数。

数据集生成

  • 字段

    • instruction:字符串,表示与元素相关的指令。
    • input:字符串,表示元素的输入细节。
    • output:字符串,表示元素的输出信息。
    • start:字符串,表示文章生效日期。
    • expiration:字符串,表示文章失效日期。
    • num:字符串,表示文章的ID。
  • 指令列表:用于生成数据集的指令列表,包括多种表达方式,如“撰写文章的全部内容”、“生成文章中的全部文本”等。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作