CS (Chinese Simile)
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CS
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于带有科幻、都市小说、爱情故事、青春等标签的在线免费小说构建和构建的。
所有明喻均采用丰富的正则表达式进行提取,对500个随机抽取的样本进行标注,估计提取精度为92%。真正鼓励进一步的数据过滤和处理!
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
CS (Chinese Simile) 是一个基于科幻、都市、爱情等类型在线小说构建的中文明喻数据集,通过正则表达式提取明喻,标注精度达92%,适用于文本阅读理解和多任务学习任务。
以上内容由遇见数据集搜集并总结生成



