five

louisbrulenaudet/cgi

收藏
Hugging Face2023-12-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/cgi
下载链接
链接失效反馈
官方服务:
资源简介:
Code Général des Impôts (CGI)数据集专注于微调预训练语言模型,以创建高效且准确的税务实践模型。微调是通过在特定任务或领域的数据上进一步训练来调整模型参数的过程。该数据集采用基于指令的微调方法,通过人类提供的指令来指导模型行为,从而提高模型在税务实践等领域的性能。数据集生成部分详细说明了数据格式,包括指令、输入和输出字段,并提供了用于生成数据集的指令列表。

Code Général des Impôts (CGI)数据集专注于微调预训练语言模型,以创建高效且准确的税务实践模型。微调是通过在特定任务或领域的数据上进一步训练来调整模型参数的过程。该数据集采用基于指令的微调方法,通过人类提供的指令来指导模型行为,从而提高模型在税务实践等领域的性能。数据集生成部分详细说明了数据格式,包括指令、输入和输出字段,并提供了用于生成数据集的指令列表。
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache 2.0
  • 语言: 法语
  • 多语言性: 单语种
  • 标签: 微调, 法律, 税务, 大语言模型, 财政, CGI, 法国税法总则
  • 源数据集: 原始数据
  • 数据集名称: Code Général des Impôts (CGI)
  • 任务类别: 文本生成, 表格问答, 摘要, 对话
  • 数据集大小: 1K<n<10K

数据集生成

  • 数据格式: JSON文件,包含字典列表,每个字典包含以下字段:

    • instruction: 字符串,表示与元素相关的指令。
    • input: 字符串,表示元素的输入细节。
    • output: 字符串,表示元素的输出信息。
  • 指令列表: 用于生成数据集的指令列表如下: python instructions = [ "Compose lintégralité de larticle sous forme écrite.", "Écris la totalité du contenu de larticle.", "Formule la totalité du texte présent dans larticle.", "Produis lintégralité de larticle en écriture.", "Développe larticle dans son ensemble par écrit.", "Génère lensemble du texte contenu dans larticle.", "Formule le contenu intégral de larticle en entier.", "Rédige la totalité du texte de larticle en entier.", "Compose lintégralité du contenu textuel de larticle.", "Rédige lensemble du texte qui constitue larticle.", "Formule larticle entier dans son contenu écrit.", "Composez lintégralité de larticle sous forme écrite.", "Écrivez la totalité du contenu de larticle.", "Formulez la totalité du texte présent dans larticle.", "Développez larticle dans son ensemble par écrit.", "Générez lensemble du texte contenu dans larticle.", "Formulez le contenu intégral de larticle en entier.", "Rédigez la totalité du texte de larticle en entier.", "Composez lintégralité du contenu textuel de larticle.", "Écrivez larticle dans son intégralité en termes de texte.", "Rédigez lensemble du texte qui constitue larticle.", "Formulez larticle entier dans son contenu écrit.", "Composer lintégralité de larticle sous forme écrite.", "Écrire la totalité du contenu de larticle.", "Formuler la totalité du texte présent dans larticle.", "Produire lintégralité de larticle en écriture.", "Développer larticle dans son ensemble par écrit.", "Générer lensemble du texte contenu dans larticle.", "Formuler le contenu intégral de larticle en entier.", "Rédiger la totalité du texte de larticle en entier.", "Composer lintégralité du contenu textuel de larticle.", "Rédiger lensemble du texte qui constitue larticle.", "Formuler larticle entier dans son contenu écrit.", "Quelles sont les dispositions de larticle ?", "Quelles dispositions sont incluses dans larticle ?", "Quelles sont les dispositions énoncées dans larticle ?", "Quel est le texte intégral de larticle ?", "Quelle est la lettre de larticle ?" ]

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作