CS
收藏魔搭社区2025-09-04 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/CS
下载链接
链接失效反馈官方服务:
资源简介:
displayName: CS (Chinese Simile)
license:
- CS Custom
mediaTypes:
- Text
paperUrl: https://arxiv.org/pdf/2012.08117v1.pdf
publishDate: "2021"
publishUrl: https://github.com/mrzjy/writing-polishment-with-simile
publisher:
- Xiaomi AI Lab
tags:
- Novels
taskTypes:
- Reading Comprehension
- Multi Task Learning
---
# 数据集介绍
## 简介
该数据集是基于带有科幻、都市小说、爱情故事、青春等标签的在线免费小说构建和构建的。
所有明喻均采用丰富的正则表达式进行提取,对500个随机抽取的样本进行标注,估计提取精度为92%。真正鼓励进一步的数据过滤和处理!
## 引文
```
@inproceedings{zhang2021writing,
title={Writing Polishment with Simile: Task, Dataset and A Neural Approach},
author={Zhang, Jiayi and Cui, Zhi and Xia, Xiaoqiang and Guo, Yalong and Li, Yanran and Wei, Chen and Cui, Jianwei},
booktitle={Proceedings of the AAAI Conference on Artificial Intelligence},
volume={35},
number={16},
pages={14383--14392},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: 显示名称:CS(中文明喻,Chinese Simile)
license: 许可证:CS自定义许可证
mediaTypes: 媒体类型:文本
paperUrl: 论文链接:https://arxiv.org/pdf/2012.08117v1.pdf
publishDate: 发布日期:2021年
publishUrl: 发布地址:https://github.com/mrzjy/writing-polishment-with-simile
publisher: 发布方:小米人工智能实验室(Xiaomi AI Lab)
tags: 标签:小说
taskTypes: 任务类型:阅读理解(Reading Comprehension)、多任务学习(Multi Task Learning)
---
# 数据集概述
## 简介
本数据集基于标注了科幻、都市、爱情、青春等题材标签的在线免费小说构建而成。
所有明喻样本均通过丰富的正则表达式规则提取;我们对随机抽取的500条样本开展了人工标注,经评估提取精度可达92%。诚挚欢迎后续开展数据过滤与处理相关研究工作!
## 引文
@inproceedings{zhang2021writing,
title={基于明喻的写作润色:任务、数据集与神经方法},
author={Zhang, Jiayi and Cui, Zhi and Xia, Xiaoqiang and Guo, Yalong and Li, Yanran and Wei, Chen and Cui, Jianwei},
booktitle={人工智能协会(AAAI)年会论文集},
volume={35},
number={16},
pages={14383--14392},
year={2021}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-05



