DogWhistle
收藏魔搭社区2024-12-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/DogWhistle
下载链接
链接失效反馈官方服务:
资源简介:
displayName: DogWhistle
labelTypes:
- Chinese Corpus
license:
- CC BY-NC 3.0
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2104.02704v2.pdf
publishDate: "2021"
publishUrl: https://competitions.codalab.org/competitions/30451
publisher:
- University of California
- Beihang University
- Microsoft Research Asia
tags:
- Cant
taskTypes: []
---
# 数据集介绍
## 简介
Cant(也称为 doublespeak、cryptlect、argot、anti-language 或 secret language)对于理解广告、喜剧和狗哨政治很重要。 DogWhistle 是一个庞大而多样的中文数据集,用于从计算语言学的角度创建和理解不能。
## 引文
```
@article{xu2021blow,
title={Blow the dog whistle: A Chinese dataset for cant understanding with common sense and world knowledge},
author={Xu, Canwen and Zhou, Wangchunshu and Ge, Tao and Xu, Ke and McAuley, Julian and Wei, Furu},
journal={arXiv preprint arXiv:2104.02704},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: DogWhistle
标签类型:
- 中文语料库(Chinese Corpus)
许可协议:
- CC BY-NC 3.0
媒体类型:
- 文本(Text)
论文链接:https://arxiv.org/pdf/2104.02704v2.pdf
发布日期:"2021"
发布平台链接:https://competitions.codalab.org/competitions/30451
发布机构:
- 加州大学(University of California)
- 北京航空航天大学(Beihang University)
- 微软亚洲研究院(Microsoft Research Asia)
标签:
- 黑话(Cant)
任务类型:
无
---
# 数据集介绍
## 简介
黑话(Cant,又称双重语言、隐语、行话、反语言或秘密语言)对于理解广告、喜剧与狗哨政治具有重要研究价值。DogWhistle是一个规模庞大、类型多样的中文数据集,旨在从计算语言学视角开展黑话的构建与理解研究。
## 引文
@article{xu2021blow,
title={吹响狗哨:融合常识与世界知识的黑话理解中文数据集},
author={徐灿文、周望舒、葛涛、徐科、Julian McAuley、魏富如},
journal={arXiv预印本 arXiv:2104.02704},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01



