five

ElWapoteDev/subreddit-maau

收藏
Hugging Face2023-08-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ElWapoteDev/subreddit-maau
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含来自r/maau子论坛的评论和回复,围绕各种主题和讨论展开。数据集旨在用于自然语言处理任务,如问答和对话生成。每个数据条目包括指令、上下文、响应和类别。数据集格式为JSON Lines,包含5.6k个条目,语言为西班牙语,采用Creative Commons Attribution-ShareAlike 4.0 International License许可。

This dataset contains comments and replies from the r/maau subreddit, covering various topics and discussions. It is intended for natural language processing (NLP) tasks such as question answering and dialogue generation. Each data entry includes an instruction, context, response, and category. The dataset is formatted as JSON Lines, contains 5.6k entries, is in Spanish, and is licensed under the Creative Commons Attribution-ShareAlike 4.0 International License.
提供机构:
ElWapoteDev
原始信息汇总

Subreddit r/maau Dataset

数据集信息

  • 名称: Subreddit r/maau Dataset
  • 格式: JSON Lines
  • 大小: 5.6k 条目
  • 许可证: Creative Commons Attribution-ShareAlike 4.0 International License
  • 语言: 西班牙语

数据结构

数据集的结构如下:

json {"instruction": "instruction_text", "context": "context_text", "response": "response_text", "category": "category_name"}

  • instruction: 用户在子版块中提供的指令或查询。
  • context: 与指令相关的额外上下文或信息(如果有)。
  • response: 对指令的响应或答案。
  • category: 交互的类别或类型,通常指示讨论的性质。

示例条目

  1. Instruction: "yo cuando 366 días del año"

    • Context: ""
    • Response: "El siguiente año es bisiesto"
    • Category: "open_qa"
  2. Instruction: "El siguiente año es bisiesto"

    • Context: ""
    • Response: "pero no este"
    • Category: "open_qa"
  3. Instruction: "pero no este"

    • Context: ""
    • Response: "Pero el reto termina el 4 de junio nor lo cual de ahuevo se suma un día"
    • Category: "open_qa"
  4. Instruction: "Pero el reto termina el 4 de junio nor lo cual de ahuevo se suma un día"

    • Context: ""
    • Response: "pero por lo general si hablas de un año te refieres a 365 días"
    • Category: "open_qa"
  5. Instruction: "Espera ese es scott??"

    • Context: ""
    • Response: "Sip ya ta viejito"
    • Category: "open_qa"

潜在用途

  • 问答: 使用数据集训练模型,根据给定的指令和上下文回答问题。
  • 对话生成: 使用数据集的对话结构训练聊天机器人或对话系统。
  • 情感分析: 分析不同类别中响应的情感。
  • 语言理解: 构建模型以理解子版块讨论中使用的语言。

引用

如果您在研究或项目中使用此数据集,请考虑按以下方式引用:

bibtex @dataset{subreddit-maau-dataset, title = {Subreddit r/maau Dataset}, author = {ElWapoteDev}, year = {2023}, publisher = {HuggingFace}, howpublished = {{https://huggingface.co/datasets/ElWapoteDev/subreddit-maau}}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作