community-datasets/diplomacy_detection
收藏Hugging Face2024-06-24 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/community-datasets/diplomacy_detection
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为HateOffensive,主要包含成对对话,标注了发送者和接收者对欺骗(或诚实)的标注。数据集包含17,289条消息,来自12个游戏。数据集的字段包括消息内容、发送者和接收者的标签、游戏得分、消息索引、季节、年份等。数据集的语言为英语,任务类别为文本分类,具体任务为意图分类。
提供机构:
community-datasets
原始信息汇总
数据集概述
基本信息
- 数据集名称: HateOffensive
- 语言: 英语
- 许可: 未知
- 数据集大小: n<1K
- 源数据: 原始数据
- 任务类别: 文本分类
- 任务ID: 意图分类
数据结构
特征
- messages: 消息文本,字符串格式。
- sender_labels: 发送者标签,表示消息是否为真,值为 false 或 true。
- receiver_labels: 接收者标签,表示消息是否被接收者认为是真的,值为 false、true 或 noannotation。
- speakers: 发言者,表示消息的发送者,值为 italy、turkey、russia、england、austria、germany、france。
- receivers: 接收者,表示消息的接收者,值为 italy、turkey、russia、england、austria、germany、france。
- absolute_message_index: 消息在游戏中的绝对索引,整数格式。
- relative_message_index: 消息在当前对话中的相对索引,整数格式。
- seasons: 季节,表示游戏中的季节,值为 spring、fall、winter。
- years: 年份,表示游戏中的年份,值为 1901 到 1918。
- game_score: 游戏得分,表示发送者的当前游戏得分,字符串格式,范围从 0 到 18。
- game_score_delta: 游戏得分差,表示发送者与接收者的游戏得分差,字符串格式,范围从 -18 到 18。
- players: 玩家,表示游戏的参与者,值为 italy、turkey、russia、england、austria、germany、france。
- game_id: 游戏ID,表示消息来自的12个游戏中的哪一个,整数格式。
数据分割
- validation: 21个实例,254292字节
- train: 189个实例,2539726字节
- test: 42个实例,506139字节
下载信息
- 下载大小: 1294604字节
- 数据集大小: 3300157字节
配置
- config_name: default
- 数据文件:
- validation: data/validation-*
- train: data/train-*
- test: data/test-*
引用信息
@inproceedings{Peskov:Cheng:Elgohary:Barrow:Danescu-Niculescu-Mizil:Boyd-Graber-2020, Title = {It Takes Two to Lie: One to Lie and One to Listen}, Author = {Denis Peskov and Benny Cheng and Ahmed Elgohary and Joe Barrow and Cristian Danescu-Niculescu-Mizil and Jordan Boyd-Graber}, Booktitle = {Association for Computational Linguistics}, Year = {2020}, Location = {Seattle}, }



