five

louisbrulenaudet/code-cinema-image-animee

收藏
Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-cinema-image-animee
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Code du cinéma et de limage animée,专注于法国电影和动画图像法律领域。数据集用于微调预训练语言模型,以创建适用于法律实践的高效准确模型。数据集生成过程中使用了指令微调(instruction-based fine-tuning)方法,通过提供具体的指令来指导模型的行为,从而提高模型在特定任务上的表现。数据集包含多个任务类别,如文本生成、表格问答、摘要生成、文本检索、问答和文本分类等。数据集的规模在1K到10K之间。

This dataset, named Code du cinéma et de limage animée, focuses on the legal domain of French cinema and animated images. It is designed for fine-tuning pre-trained language models to create efficient and accurate models for legal practice. The dataset generation process employs instruction-based fine-tuning, which uses specific instructions to guide the models behavior, thereby enhancing its performance on specific tasks. The dataset includes multiple task categories such as text generation, table-question-answering, summarization, text retrieval, question-answering, and text classification. The dataset size ranges between 1K and 10K.
提供机构:
louisbrulenaudet
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 法语
  • 多语言性: 单语种
  • 标签:
    • 微调
    • 法律
    • 法国法律
    • 法国电影与动画影像法典
  • 源数据集: 原始数据
  • 美观名称: 法国电影与动画影像法典
  • 任务类别:
    • 文本生成
    • 表格问题回答
    • 摘要生成
    • 文本检索
    • 问答
    • 文本分类
  • 大小类别: 1K<n<10K

数据集生成

  • 数据结构: JSON文件,每个字典包含以下字段:
    • instruction: 字符串,与元素相关的指令。
    • input: 字符串,元素的输入细节。
    • output: 字符串,元素的输出信息。
    • start: 字符串,文章生效日期。
    • expiration: 字符串,文章失效日期。
    • num: 字符串,文章ID。
  • 生成指令: 使用了一系列指令来生成数据集,主要涉及撰写和表述文章的完整内容。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作