李宏毅机器学习2022spring-hw7
收藏魔搭社区2025-07-22 更新2025-07-26 收录
下载链接:
https://modelscope.cn/datasets/Mrzzzz/ml2022spring-hw7
下载链接
链接失效反馈官方服务:
资源简介:
数据集文件元信息以及数据文件,请浏览“数据集文件”页面获取。
当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
- Training set: 31690 QA pairs
- Dev set: 4131 QA pairs
- Test set: 4957 QA pairs
- {train/dev/test}_questions:
- List of dicts with the following keys:
- id (int)
- paragraph_id (int)
- question_text (string)
- answer_text (string)
- answer_start (int)
- answer_end (int)
- {train/dev/test}_paragraphs:
- List of strings
- paragraph_ids in questions correspond to indexs in paragraphs
- A paragraph may be used by several questions
本数据集的文件元信息与数据文件,请前往「数据集文件」页面获取。
当前数据集卡片采用默认模板制作,数据集贡献者未提供更详尽的数据集说明,但您可通过以下Git Clone命令或ModelScope SDK下载该数据集。
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
- 训练集(Training set):31690组问答对(QA pairs)
- 开发集(Dev set):4131组问答对(QA pairs)
- 测试集(Test set):4957组问答对(QA pairs)
- {train/dev/test}_questions:
- 包含以下键名的字典列表:
- id(整数类型)
- paragraph_id(整数类型)
- question_text(字符串类型)
- answer_text(字符串类型)
- answer_start(整数类型)
- answer_end(整数类型)
- {train/dev/test}_paragraphs:
- 字符串列表
- 问答中的paragraph_ids与paragraphs列表中的索引一一对应
- 单个段落可被多个问答引用
提供机构:
maas
创建时间:
2025-07-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是李宏毅机器学习2022年春季课程作业7的数据集,包含训练集、开发集和测试集,总计超过4万对问答对,用于机器阅读理解任务。数据格式以问题-段落对为主,问题包含答案位置信息,段落可被多个问题复用。
以上内容由遇见数据集搜集并总结生成



