five

DogWhistle

收藏
魔搭社区2024-12-19 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/DogWhistle
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: DogWhistle labelTypes: - Chinese Corpus license: - CC BY-NC 3.0 mediaTypes: - Text paperUrl: https://arxiv.org/pdf/2104.02704v2.pdf publishDate: "2021" publishUrl: https://competitions.codalab.org/competitions/30451 publisher: - University of California - Beihang University - Microsoft Research Asia tags: - Cant taskTypes: [] --- # 数据集介绍 ## 简介 Cant(也称为 doublespeak、cryptlect、argot、anti-language 或 secret language)对于理解广告、喜剧和狗哨政治很重要。 DogWhistle 是一个庞大而多样的中文数据集,用于从计算语言学的角度创建和理解不能。 ## 引文 ``` @article{xu2021blow, title={Blow the dog whistle: A Chinese dataset for cant understanding with common sense and world knowledge}, author={Xu, Canwen and Zhou, Wangchunshu and Ge, Tao and Xu, Ke and McAuley, Julian and Wei, Furu}, journal={arXiv preprint arXiv:2104.02704}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: DogWhistle 标签类型: - 中文语料库(Chinese Corpus) 许可协议: - CC BY-NC 3.0 媒体类型: - 文本(Text) 论文链接:https://arxiv.org/pdf/2104.02704v2.pdf 发布日期:"2021" 发布平台链接:https://competitions.codalab.org/competitions/30451 发布机构: - 加州大学(University of California) - 北京航空航天大学(Beihang University) - 微软亚洲研究院(Microsoft Research Asia) 标签: - 黑话(Cant) 任务类型: 无 --- # 数据集介绍 ## 简介 黑话(Cant,又称双重语言、隐语、行话、反语言或秘密语言)对于理解广告、喜剧与狗哨政治具有重要研究价值。DogWhistle是一个规模庞大、类型多样的中文数据集,旨在从计算语言学视角开展黑话的构建与理解研究。 ## 引文 @article{xu2021blow, title={吹响狗哨:融合常识与世界知识的黑话理解中文数据集}, author={徐灿文、周望舒、葛涛、徐科、Julian McAuley、魏富如}, journal={arXiv预印本 arXiv:2104.02704}, year={2021} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-01
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作