five

Garfieldgx/DataSet_for_thesis

收藏
Hugging Face2023-03-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Garfieldgx/DataSet_for_thesis
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于文本分类任务的,由AutoTrain自动处理,项目名称为severe-js100-sentiment。数据集的BCP-47语言代码为unk,表示语言未知。数据集包含文本和标签两个字段,文本字段为字符串类型,标签字段为分类标签,包含三个类别。数据集被分为训练集和验证集,训练集包含5348个样本,验证集包含1339个样本。

该数据集是用于文本分类任务的,由AutoTrain自动处理,项目名称为severe-js100-sentiment。数据集的BCP-47语言代码为unk,表示语言未知。数据集包含文本和标签两个字段,文本字段为字符串类型,标签字段为分类标签,包含三个类别。数据集被分为训练集和验证集,训练集包含5348个样本,验证集包含1339个样本。
提供机构:
Garfieldgx
原始信息汇总

AutoTrain Dataset for project: severe-js100-sentiment

数据集描述

该数据集由AutoTrain自动处理,用于项目severe-js100-sentiment。

语言

数据集的语言BCP-47代码为unk。

数据集结构

数据实例

数据集的一个样本如下所示:

json [ { "text": "00:58 #u0e2du0e38u0e1au0e31u0e15u0e34u0e40u0e2bu0e15u0e38 #u0e16u0e19u0e19u0e1au0e32u0e07u0e1au0e2du0e193 u0e0au0e48u0e27u0e07u0e42u0e23u0e07u0e40u0e23u0e35u0e22u0e19u0e2au0e32u0e23u0e2au0e32u0e2au0e19u0e4cu0e27u0e34u0e40u0e17u0e28u0e1au0e32u0e07u0e1au0e2du0e19 >u0e42u0e23u0e07u0e40u0e23u0e35u0e22u0e19u0e01u0e23u0e1eu0e34u0e17u0e31u0e01u0e29u0e4cu0e28u0e36u0e01u0e29u0e32 u0e1bu0e32u0e01u0e0bu0e2du0e22u0e1au0e32u0e07u0e1au0e2du0e193u0e0bu0e2du0e225 u0e23u0e16u0e08u0e31u0e01u0e23u0e22u0e32u0e19u0e22u0e19u0e15u0e4cu0e40u0e2au0e35u0e22u0e2bu0e25u0e31u0e01u0e25u0e49u0e21 u0e02u0e27u0e32u0e07u0e0au0e48u0e2du0e07u0e17u0e32u0e07u0e0bu0e49u0e32u0e22", "target": 2 }, { "text": "03:22 #u0e2du0e38u0e1au0e31u0e15u0e34u0e40u0e2bu0e15u0e38 #u0e16u0e19u0e19u0e01u0e32u0e0du0e08u0e19u0e32u0e20u0e34u0e40u0e29u0e01 u0e0au0e48u0e27u0e07u0e2au0e30u0e1eu0e32u0e19u0e02u0e49u0e32u0e21u0e04u0e25u0e2du0e07u0e20u0e32u0e29u0e35u0e40u0e08u0e23u0e34u0e0d >u0e41u0e22u0e01u0e1au0e32u0e07u0e41u0e27u0e01 u0e1au0e19u0e15u0e48u0e32u0e07u0e23u0e30u0e14u0e31u0e1au0e40u0e1eu0e0au0e23u0e40u0e01u0e29u0e21 u0e23u0e16u0e1bu0e34u0e04u0e2du0e31u0e1eu0e40u0e2au0e35u0e22u0e2bu0e25u0e31u0e01u0e0au0e19u0e02u0e2du0e1au0e17u0e32u0e07 u0e02u0e27u0e32u0e07u0e0au0e48u0e2du0e07u0e17u0e32u0e07u0e0bu0e49u0e32u0e22", "target": 2 } ]

数据集字段

数据集包含以下字段(也称为“特征”):

json { "text": "Value(dtype=string, id=None)", "target": "ClassLabel(names=[u0e23u0e38u0e19u0e41u0e23u0e07, u0e23u0e38u0e19u0e41u0e23u0e07u0e21u0e32u0e01, u0e44u0e21u0e48u0e23u0e38u0e19u0e41u0e23u0e07], id=None)" }

数据集分割

该数据集分为训练集和验证集。分割大小如下:

分割名称 样本数量
train 5348
valid 1339
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作