five

? Yahoo Answers 雅虎问答十大类

收藏
Data Castle2022-07-28 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=2060
下载链接
链接失效反馈
官方服务:
资源简介:
#### 背景描述 数据集由 10 个最大的主要类别构建,每个类包含 140,000 个训练样本和 6,000 个测试样本。因此,该数据集中的训练样本总数为 1,400,000,测试样本总数为 60,000。 #### 数据说明 文件 **classes.txt **包含与每个标签对应的类列表。 文件** train.csv **和** test.csv **包含所有以逗号分隔的训练样本。其中有4列,分别对应班级索引(1到10)、题目、题目内容和最佳答案。文本字段使用双引号 (") 进行转义,任何内部双引号都使用 2 个双引号 ("") 进行转义。新行使用反斜杠进行转义,后跟“n”字符,即“\n”。 十大类别: - 1 = 社会与文化 - 2 = 科学与数学 - 3 = 健康 - 4 = 教育和参考 - 5 = 电脑和互联网 - 6 = 运动 - 7 = 商业与金融 - 8 = 娱乐和音乐 - 9 = 家庭与人际关系 - 10 = 政治与政府 #### 数据来源 yahoo #### 问题描述 NLP
提供机构:
cascomix
二维码
社区交流群
二维码
科研交流群
商业服务