five

nguyenthanhdo/orca-unanswerable-v2.0

收藏
Hugging Face2023-11-28 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/nguyenthanhdo/orca-unanswerable-v2.0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个分割:long_excuse和short_excuse,分别对应长借口和短借口。数据集的特征包括id、system_prompt、question、response、question_word_count、response_word_count和from字段。数据集的主要用途是通过过滤和合并操作,生成包含不可回答问题的借口的数据集,并将其推送到Hugging Face Hub。

该数据集包含两个分割:long_excuse和short_excuse,分别对应长借口和短借口。数据集的特征包括id、system_prompt、question、response、question_word_count、response_word_count和from字段。数据集的主要用途是通过过滤和合并操作,生成包含不可回答问题的借口的数据集,并将其推送到Hugging Face Hub。
提供机构:
nguyenthanhdo
原始信息汇总

数据集概述

配置

  • 默认配置
    • 数据文件
      • 长借口:路径为 data/long_excuse-*
      • 短借口:路径为 data/short_excuse-*

数据集信息

  • 特征

    • id:字符串类型
    • system_prompt:字符串类型
    • question:字符串类型
    • response:字符串类型
    • question_word_count:64位整数类型
    • response_word_count:64位整数类型
    • from:字符串类型
  • 分割

    • 长借口
      • 字节数:90070208.6254609
      • 样本数:34520
    • 短借口
      • 字节数:107366715.3745391
      • 样本数:41149
  • 下载大小:117180271 字节

  • 数据集大小:197436924.0 字节

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作