louisbrulenaudet/code-cinema-image-animee
收藏Hugging Face2024-07-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/louisbrulenaudet/code-cinema-image-animee
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Code du cinéma et de limage animée,专注于法国电影和动画图像法律领域。数据集用于微调预训练语言模型,以创建适用于法律实践的高效准确模型。数据集生成过程中使用了指令微调(instruction-based fine-tuning)方法,通过提供具体的指令来指导模型的行为,从而提高模型在特定任务上的表现。数据集包含多个任务类别,如文本生成、表格问答、摘要生成、文本检索、问答和文本分类等。数据集的规模在1K到10K之间。
This dataset, named Code du cinéma et de limage animée, focuses on the legal domain of French cinema and animated images. It is designed for fine-tuning pre-trained language models to create efficient and accurate models for legal practice. The dataset generation process employs instruction-based fine-tuning, which uses specific instructions to guide the models behavior, thereby enhancing its performance on specific tasks. The dataset includes multiple task categories such as text generation, table-question-answering, summarization, text retrieval, question-answering, and text classification. The dataset size ranges between 1K and 10K.
提供机构:
louisbrulenaudet
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 法语
- 多语言性: 单语种
- 标签:
- 微调
- 法律
- 法国法律
- 法国电影与动画影像法典
- 源数据集: 原始数据
- 美观名称: 法国电影与动画影像法典
- 任务类别:
- 文本生成
- 表格问题回答
- 摘要生成
- 文本检索
- 问答
- 文本分类
- 大小类别: 1K<n<10K
数据集生成
- 数据结构: JSON文件,每个字典包含以下字段:
instruction: 字符串,与元素相关的指令。input: 字符串,元素的输入细节。output: 字符串,元素的输出信息。start: 字符串,文章生效日期。expiration: 字符串,文章失效日期。num: 字符串,文章ID。
- 生成指令: 使用了一系列指令来生成数据集,主要涉及撰写和表述文章的完整内容。



