five

developerh/test|文本分类数据集

收藏
hugging_face2023-11-27 更新2024-03-04 收录
文本分类
下载链接:
https://hf-mirror.com/datasets/developerh/test
下载链接
链接失效反馈
资源简介:
--- task_categories: - text-classification ---
提供机构:
developerh
原始信息汇总

数据集任务类别

  • 文本分类
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

Food101

Food101是一个包含101种食物类别的数据集,共有101,000张图片。每个类别提供250张手动审查的测试图像和750张训练图像。训练图像未经清理,因此仍包含一定量的噪声。所有图像都被缩放到最大边长为512像素。图像包括光照、视角和背景的变化,使其成为一个具有挑战性的数据集。

github 收录

FACED

FACED数据集是由清华大学脑与智能实验室和智能技术与系统国家重点实验室共同创建,包含从123名参与者收集的32通道EEG信号,用于情感计算研究。数据集通过记录参与者观看28个情感诱发视频片段时的EEG信号构建,旨在通过EEG信号分析情感状态。创建过程中,数据经过标准化和统一预处理,设计了四个EEG分类任务。该数据集主要应用于情感识别和脑机接口领域,旨在解决情感计算中的分类问题,提高情感识别的准确性和效率。

arXiv 收录

电商购物用户行为分析数据

电商购物用户行为分析数据 这份数据集是一个顾客购物信息的集合,记录了不同顾客在不同时间的购物行为。每一行代表一个单独的购物发票记录,数据集中包含了以下属性: 数据属性: 1. invoice_no: 发票号码,是每次交易的唯一标识符。 2. customer_id: 顾客的ID,用于标识不同的顾客。 3. gender: 顾客的性别,分为"Male"(男性)和"Female"(女性)。 4. age: 顾客的年龄。 5. category: 顾客购买的商品类别,如"Clothing"(服装)、"Shoes"(鞋子)、"Books"(书籍)、"Cosmetics"(化妆品)、"Toys"(玩具)、"Food & Beverage"(食品和饮料)、"Technology"(科技产品)、"Souvenir"(纪念品)等。 6. quantity: 顾客购买的商品数量。 7. price: 顾客为这次购物支付的总金额。 8. payment_method: 顾客使用的支付方式,包括"Alipay"(支付宝)、"WeChat Pay"(微信支付)、"Card"(银行卡)。 9. invoice_date: 发票日期,记录了交易发生的日期。

阿里云天池 收录