five

AxeML/MediumSetPT

收藏
Hugging Face2025-05-03 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/AxeML/MediumSetPT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含40,000个样本的结构化数据集,旨在用于自然语言处理(NLP)任务,特别是关注于主题性问题与答案的开发。每个样本都是JSON格式,包含唯一标识符、主题列表、问题集以及一个包含对提出问题的自然语言回答的字段。数据集适用于文本生成、语言模型微调、文本理解、生成性对话响应、主题分类以及文本的连贯性和一致性研究等应用场景。

This dataset is a structured collection of 40,000 samples designed for Natural Language Processing (NLP) tasks, with a focus on thematic questions and answers development. Each sample is in JSON format, containing a unique identifier, a list of topics, a set of questions, and a field with a natural language response to the posed questions. The dataset is suitable for applications such as text generation, language model fine-tuning, text comprehension, generative dialogue response, thematic classification, and studies on textual coherence and consistency.
提供机构:
AxeML
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作