five

MLP-SEMA/sema_dataset_38k

收藏
Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MLP-SEMA/sema_dataset_38k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个配置:greedy_response、greedy_response_ko和questions。greedy_response配置包含id、source、question和response字段,训练集有38504个样本。greedy_response_ko配置在greedy_response的基础上增加了question_ko和response_ko字段,同样有38504个训练样本。questions配置包含id、source和question字段,训练集也有38504个样本。

该数据集包含三个配置:greedy_response、greedy_response_ko和questions。greedy_response配置包含id、source、question和response字段,训练集有38504个样本。greedy_response_ko配置在greedy_response的基础上增加了question_ko和response_ko字段,同样有38504个训练样本。questions配置包含id、source和question字段,训练集也有38504个样本。
提供机构:
MLP-SEMA
原始信息汇总

数据集概述

数据集配置

配置1: greedy_response

  • 特征:
    • id: string
    • source: string
    • question: string
    • response: string
  • 分割:
    • train:
      • 字节数: 45920036
      • 样本数: 38504
  • 下载大小: 26704330
  • 数据集大小: 45920036

配置2: greedy_response_ko

  • 特征:
    • id: string
    • source: string
    • question: string
    • response: string
    • question_ko: string
    • response_ko: string
  • 分割:
    • train:
      • 字节数: 98115716
      • 样本数: 38504
  • 下载大小: 56374193
  • 数据集大小: 98115716

配置3: questions

  • 特征:
    • id: string
    • source: string
    • question: string
  • 分割:
    • train:
      • 字节数: 8451758
      • 样本数: 38504
  • 下载大小: 5005388
  • 数据集大小: 8451758

数据文件路径

  • greedy_response:
    • train: greedy_response/train-*
  • greedy_response_ko:
    • train: greedy_response_ko/train-*
  • questions:
    • train: questions/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作