mrinaldi/Proposte_LLM

Name: mrinaldi/Proposte_LLM
Creator: mrinaldi
Published: 2024-03-03 21:26:32
License: 暂无描述

Hugging Face2024-03-03 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/mrinaldi/Proposte_LLM

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集提案旨在创建用于训练和微调大型语言模型（LLM）的高质量、多语言数据集，特别是针对意大利语。提案包括创建问答对数据集、文本理解数据集以及推理和思维链数据集。作者强调了当前数据集的问题，如过度依赖英语和文化偏见，并提出了通过众包等方式收集高质量数据的建议。

提供机构：

mrinaldi

原始信息汇总

数据集概述

学术领域：
- 目的：提供模型必要的抽象能力，以便在受到询问时进行回答。
- 特点：强调复杂问题的详细和深入回答。
- 实现方式：通过众包平台，鼓励学生上传基于其大学笔记或知识的问答对。
- 优先考虑复杂、具体且涉及一定推理的学术问题。
通用领域：
- 涵盖广泛的任务，如故事生成、诗歌创作、社交媒体帖子描述、电子邮件撰写、广告口号等。
- 挑战：可能包含个人观点、偏见、伦理考虑和质量问题。
- 实现方式：通过众包，尝试简化任务，如文本摘要、风格转换、简单问答等。

5,000+

优质数据集

54 个

任务类型

进入经典数据集