community-datasets/diplomacy_detection

Name: community-datasets/diplomacy_detection
Creator: community-datasets
Published: 2024-06-24 11:25:52
License: 暂无描述

Hugging Face2024-06-24 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/community-datasets/diplomacy_detection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为HateOffensive，主要包含成对对话，标注了发送者和接收者对欺骗（或诚实）的标注。数据集包含17,289条消息，来自12个游戏。数据集的字段包括消息内容、发送者和接收者的标签、游戏得分、消息索引、季节、年份等。数据集的语言为英语，任务类别为文本分类，具体任务为意图分类。

提供机构：

community-datasets

原始信息汇总

数据集概述

基本信息

数据集名称: HateOffensive
语言: 英语
许可: 未知
数据集大小: n<1K
源数据: 原始数据
任务类别: 文本分类
任务ID: 意图分类

数据结构

特征

messages: 消息文本，字符串格式。
sender_labels: 发送者标签，表示消息是否为真，值为 false 或 true。
receiver_labels: 接收者标签，表示消息是否被接收者认为是真的，值为 false、true 或 noannotation。
speakers: 发言者，表示消息的发送者，值为 italy、turkey、russia、england、austria、germany、france。
receivers: 接收者，表示消息的接收者，值为 italy、turkey、russia、england、austria、germany、france。
absolute_message_index: 消息在游戏中的绝对索引，整数格式。
relative_message_index: 消息在当前对话中的相对索引，整数格式。
seasons: 季节，表示游戏中的季节，值为 spring、fall、winter。
years: 年份，表示游戏中的年份，值为 1901 到 1918。
game_score: 游戏得分，表示发送者的当前游戏得分，字符串格式，范围从 0 到 18。
game_score_delta: 游戏得分差，表示发送者与接收者的游戏得分差，字符串格式，范围从 -18 到 18。
players: 玩家，表示游戏的参与者，值为 italy、turkey、russia、england、austria、germany、france。
game_id: 游戏ID，表示消息来自的12个游戏中的哪一个，整数格式。

数据分割

validation: 21个实例，254292字节
train: 189个实例，2539726字节
test: 42个实例，506139字节

下载信息

下载大小: 1294604字节
数据集大小: 3300157字节

配置

config_name: default
数据文件:
- validation: data/validation-*
- train: data/train-*
- test: data/test-*

引用信息

@inproceedings{Peskov:Cheng:Elgohary:Barrow:Danescu-Niculescu-Mizil:Boyd-Graber-2020, Title = {It Takes Two to Lie: One to Lie and One to Listen}, Author = {Denis Peskov and Benny Cheng and Ahmed Elgohary and Joe Barrow and Cristian Danescu-Niculescu-Mizil and Jordan Boyd-Graber}, Booktitle = {Association for Computational Linguistics}, Year = {2020}, Location = {Seattle}, }

5,000+

优质数据集

54 个

任务类型

进入经典数据集