five

Chinese_Classifier

收藏
魔搭社区2024-09-01 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Chinese_Classifier
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Chinese Classifier labelTypes: - Text - Chinese Corpus license: - CC BY-NC-SA 4.0 mediaTypes: - Text paperUrl: https://aclanthology.org/I17-3011.pdf publishDate: "2017" publishUrl: https://github.com/wuningxi/ChineseClassifierDataset publisher: - National Taiwan University - University of Warwick - Alan Turing Institute tags: - Chinese taskTypes: - Natural Language Generation - Reading Comprehension --- # 数据集介绍 ## 简介 量词是汉语中用来表达数量的虚词,对语言学习者来说尤其困难。这个中文分类器数据集可用于根据上下文预测中文分类器。 该数据集包含大量来自三种语言语料库(普通话兰开斯特语料库、UCLA 书面汉语语料库和莱顿微博语料库)的中文分类器使用示例句子。为基于上下文的分类器预测任务清理和处理数据。 ## 引文 ``` @inproceedings{peinelt2017classifierguesser, title={ClassifierGuesser: A context-based classifier prediction system for chinese language learners}, author={Peinelt, Nicole and Liakata, Maria and Hsieh, Shu-Kai}, booktitle={Proceedings of the IJCNLP 2017, System Demonstrations}, pages={41--44}, year={2017} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: 中文分类器数据集(Chinese Classifier) labelTypes: - 文本(Text) - 中文语料库(Chinese Corpus) license: - CC BY-NC-SA 4.0 mediaTypes: - 文本(Text) paperUrl: https://aclanthology.org/I17-3011.pdf publishDate: "2017" publishUrl: https://github.com/wuningxi/ChineseClassifierDataset publisher: - 台湾大学 - 华威大学 - 艾伦·图灵研究所 tags: - 中文(Chinese) taskTypes: - 自然语言生成(Natural Language Generation) - 阅读理解(Reading Comprehension) --- # 数据集介绍 ## 简介 量词是汉语中用来表达数量的虚词,对语言学习者来说尤其困难。本中文分类器(Chinese Classifier)数据集可用于根据上下文预测中文分类器。 该数据集包含大量来自三种中文语料库(普通话兰开斯特语料库、加州大学洛杉矶分校(UCLA)书面汉语语料库和莱顿微博语料库)的中文分类器使用示例句子。针对基于上下文的分类器预测任务完成了数据清洗与预处理工作。 ## 引文 @inproceedings{peinelt2017classifierguesser, title={ClassifierGuesser: A context-based classifier prediction system for chinese language learners}, author={Peinelt, Nicole and Liakata, Maria and Hsieh, Shu-Kai}, booktitle={Proceedings of the IJCNLP 2017, System Demonstrations}, pages={41--44}, year={2017} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作