? Yahoo Answers 雅虎问答十大类
收藏Data Castle2022-07-28 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=2060
下载链接
链接失效反馈官方服务:
资源简介:
#### 背景描述
数据集由 10 个最大的主要类别构建,每个类包含 140,000 个训练样本和 6,000 个测试样本。因此,该数据集中的训练样本总数为 1,400,000,测试样本总数为 60,000。
#### 数据说明
文件 **classes.txt **包含与每个标签对应的类列表。
文件** train.csv **和** test.csv **包含所有以逗号分隔的训练样本。其中有4列,分别对应班级索引(1到10)、题目、题目内容和最佳答案。文本字段使用双引号 (") 进行转义,任何内部双引号都使用 2 个双引号 ("") 进行转义。新行使用反斜杠进行转义,后跟“n”字符,即“\n”。
十大类别:
- 1 = 社会与文化
- 2 = 科学与数学
- 3 = 健康
- 4 = 教育和参考
- 5 = 电脑和互联网
- 6 = 运动
- 7 = 商业与金融
- 8 = 娱乐和音乐
- 9 = 家庭与人际关系
- 10 = 政治与政府
#### 数据来源
yahoo
#### 问题描述
NLP
提供机构:
cascomix



