five

islamrokon/Test

收藏
hugging_face2023-11-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/islamrokon/Test
下载链接
链接失效反馈
资源简介:
--- configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* dataset_info: features: - name: question dtype: string - name: answer dtype: string - name: input_ids sequence: int32 - name: attention_mask sequence: int32 - name: labels sequence: int64 splits: - name: train num_bytes: 17012.625 num_examples: 14 - name: test num_bytes: 2430.375 num_examples: 2 download_size: 17101 dataset_size: 19443.0 --- # Dataset Card for "Test" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
islamrokon
原始信息汇总

数据集概述

配置

  • 默认配置
    • 训练数据
      • 路径:data/train-*
    • 测试数据
      • 路径:data/test-*

数据特征

  • 问题
    • 数据类型:字符串
  • 答案
    • 数据类型:字符串
  • 输入ID
    • 数据类型:整数序列(int32)
  • 注意力掩码
    • 数据类型:整数序列(int32)
  • 标签
    • 数据类型:整数序列(int64)

数据分割

  • 训练集
    • 字节数:17012.625
    • 样本数:14
  • 测试集
    • 字节数:2430.375
    • 样本数:2

数据大小

  • 下载大小:17101字节
  • 数据集大小:19443.0字节
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

ERIC (Education Resources Information Center)

ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。

eric.ed.gov 收录

AirSafe_DB

该数据集包含了从Plane Crash Info网站上抓取的飞机事故的结构化信息,原始数据为CSV格式,经过AI模型处理后生成了标准化的JSON格式数据。数据集包含5049条记录,每条记录包括事故信息(日期、时间、地点等)、飞机信息(运营商、航班号、机型等)、伤亡统计(总死亡人数、机组人员、乘客、地面人员等)、事故摘要(事故描述、事故类型、飞行阶段等)等内容。数据经过标准化处理,确保数据质量和一致性,适用于分析和研究。

huggingface 收录

垃圾分类数据集

华为云垃圾分类训练集:分为训练集和测试集,训练集为原华为云垃圾分类比赛数据集,测试集为另外添加图片。大致分为4类,"0": "其他垃圾/一次性快餐盒", "1": "其他垃圾/污损塑料", "2": "其他垃圾/烟蒂", "3": "其他垃圾/牙签", "4": "其他垃圾/破碎花盆及碟碗", "5": "其他垃圾/竹筷", 1 "6": "厨余垃圾/剩饭剩菜", "7": "厨余垃圾/大骨头", "8": "厨余垃圾/水果果皮", "9": "厨余垃圾/水果果肉", "10": "厨余垃圾/茶叶渣", "11": "厨余垃圾/菜叶菜根", "12": "厨余垃圾/蛋壳", "13": "厨余垃圾/鱼骨", 2 "14": "可回收物/充电宝", "15": "可回收物/包", "16": "可回收物/化妆品瓶", "17": "可回收物/塑料玩具", "18": "可回收物/塑料碗盆", "19": "可回收物/塑料衣架", "20": "可回收物/快递纸袋", "21": "可回收物/插头电线", "22": "可回收物/旧衣服", "23": "可回收物/易拉罐", "24": "可回收物/枕头", "25": "可回收物/毛绒玩具", "26": "可回收物/洗发水瓶", "27": "可回收物/玻璃杯", "28": "可回收物/皮鞋", "29": "可回收物/砧板", "30": "可回收物/纸板箱", "31": "可回收物/调料瓶", "32": "可回收物/酒瓶", "33": "可回收物/金属食品罐", "34": "可回收物/锅", "35": "可回收物/食用油桶", "36": "可回收物/饮料瓶", 3 "37": "有害垃圾/干电池", "38": "有害垃圾/软膏", "39": "有害垃圾/过期药物"

阿里云天池 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录