d-llm/sentiment_analysis_v1.0

Name: d-llm/sentiment_analysis_v1.0
Creator: d-llm
Published: 2024-06-24 06:36:16
License: 暂无描述

Hugging Face2024-06-24 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/d-llm/sentiment_analysis_v1.0

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含指令、评分和预测三个主要字段。评分字段是一个结构体，包含多个子字段，如身份攻击、侮辱、亵渎、严重毒性、威胁和毒性等，每个子字段都是float64类型。预测字段是一个字符串序列。数据集只有一个训练分割，包含16246个样本，文件大小为3126914字节。

数据集信息：特征字段： - 名称：指令（instruction），数据类型：字符串 - 名称：评分（score），数据结构： - 名称：身份攻击（IDENTITY_ATTACK），数据类型：64位浮点数 - 名称：侮辱（INSULT），数据类型：64位浮点数 - 名称：粗俗语言（PROFANITY），数据类型：64位浮点数 - 名称：严重毒性（SEVERE_TOXICITY），数据类型：64位浮点数 - 名称：威胁（THREAT），数据类型：64位浮点数 - 名称：毒性（TOXICITY），数据类型：64位浮点数 - 名称：预测结果（predict），数据类型：字符串序列数据集划分： - 名称：训练集（train），字节数：3126914，样本数：16246 下载大小：1317924，数据集大小：3126914 配置项： - 配置名称：默认配置（default），数据文件： - 划分集：训练集（train），文件路径：data/train-*

提供机构：

d-llm

原始信息汇总

数据集概述

数据集信息

特征

instruction: 类型为字符串。
score: 包含以下结构化数据：
- IDENTITY_ATTACK: 类型为浮点数（float64）。
- INSULT: 类型为浮点数（float64）。
- PROFANITY: 类型为浮点数（float64）。
- SEVERE_TOXICITY: 类型为浮点数（float64）。
- THREAT: 类型为浮点数（float64）。
- TOXICITY: 类型为浮点数（float64）。
predict: 类型为字符串序列。

数据分割

train: 包含3,126,914字节的数据，共有16,246个样本。

数据集大小

下载大小: 1,317,924字节。
数据集大小: 3,126,914字节。

配置

default: 包含训练数据文件，路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集