dru-ac/ArTopicDS-Books
收藏Hugging Face2024-07-08 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/dru-ac/ArTopicDS-Books
下载链接
链接失效反馈官方服务:
资源简介:
该数据集涵盖了宗教、经济、政治、人类学与社会学、艺术与文学、教育、历史、语言与语言学、哲学和法律等多个领域的书籍。数据集的构建方法是提取每本书标题后的第一句话,有时也包括每段后的第一句话。
The books used in this dataset spanned the areas of Religion, Economy, Politics, Anthropology and Sociology, Art and Literature, Education, History, Language and Linguistics, Philosophy, and Law. Only first sentences after each title of the books have been extracted. For some books, the first sentence after each paragraph was taken.
提供机构:
dru-ac
原始信息汇总
数据集概述
任务类别
- 文本分类
- 零样本分类
- 文本生成
语言
- 阿拉伯语
数据规模
- 10K<n<100K
数据来源领域
- 宗教
- 经济
- 政治
- 人类学与社会学
- 艺术与文学
- 教育
- 历史
- 语言与语言学
- 哲学
- 法律
数据提取方式
- 仅提取每本书标题后的第一句话
- 对于某些书籍,提取每段落后的第一句话



