five

community-datasets/diplomacy_detection

收藏
Hugging Face2024-06-24 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/community-datasets/diplomacy_detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为HateOffensive,主要包含成对对话,标注了发送者和接收者对欺骗(或诚实)的标注。数据集包含17,289条消息,来自12个游戏。数据集的字段包括消息内容、发送者和接收者的标签、游戏得分、消息索引、季节、年份等。数据集的语言为英语,任务类别为文本分类,具体任务为意图分类。
提供机构:
community-datasets
原始信息汇总

数据集概述

基本信息

  • 数据集名称: HateOffensive
  • 语言: 英语
  • 许可: 未知
  • 数据集大小: n<1K
  • 源数据: 原始数据
  • 任务类别: 文本分类
  • 任务ID: 意图分类

数据结构

特征

  • messages: 消息文本,字符串格式。
  • sender_labels: 发送者标签,表示消息是否为真,值为 false 或 true。
  • receiver_labels: 接收者标签,表示消息是否被接收者认为是真的,值为 false、true 或 noannotation。
  • speakers: 发言者,表示消息的发送者,值为 italy、turkey、russia、england、austria、germany、france。
  • receivers: 接收者,表示消息的接收者,值为 italy、turkey、russia、england、austria、germany、france。
  • absolute_message_index: 消息在游戏中的绝对索引,整数格式。
  • relative_message_index: 消息在当前对话中的相对索引,整数格式。
  • seasons: 季节,表示游戏中的季节,值为 spring、fall、winter。
  • years: 年份,表示游戏中的年份,值为 1901 到 1918。
  • game_score: 游戏得分,表示发送者的当前游戏得分,字符串格式,范围从 0 到 18。
  • game_score_delta: 游戏得分差,表示发送者与接收者的游戏得分差,字符串格式,范围从 -18 到 18。
  • players: 玩家,表示游戏的参与者,值为 italy、turkey、russia、england、austria、germany、france。
  • game_id: 游戏ID,表示消息来自的12个游戏中的哪一个,整数格式。

数据分割

  • validation: 21个实例,254292字节
  • train: 189个实例,2539726字节
  • test: 42个实例,506139字节

下载信息

  • 下载大小: 1294604字节
  • 数据集大小: 3300157字节

配置

  • config_name: default
  • 数据文件:
    • validation: data/validation-*
    • train: data/train-*
    • test: data/test-*

引用信息

@inproceedings{Peskov:Cheng:Elgohary:Barrow:Danescu-Niculescu-Mizil:Boyd-Graber-2020, Title = {It Takes Two to Lie: One to Lie and One to Listen}, Author = {Denis Peskov and Benny Cheng and Ahmed Elgohary and Joe Barrow and Cristian Danescu-Niculescu-Mizil and Jordan Boyd-Graber}, Booktitle = {Association for Computational Linguistics}, Year = {2020}, Location = {Seattle}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作