five

李宏毅机器学习2022spring-hw7

收藏
魔搭社区2025-07-22 更新2025-07-26 收录
下载链接:
https://modelscope.cn/datasets/Mrzzzz/ml2022spring-hw7
下载链接
链接失效反馈
官方服务:
资源简介:
数据集文件元信息以及数据文件,请浏览“数据集文件”页面获取。 当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} - Training set: 31690 QA pairs - Dev set: 4131 QA pairs - Test set: 4957 QA pairs - {train/dev/test}_questions: - List of dicts with the following keys: - id (int) - paragraph_id (int) - question_text (string) - answer_text (string) - answer_start (int) - answer_end (int) - {train/dev/test}_paragraphs: - List of strings - paragraph_ids in questions correspond to indexs in paragraphs - A paragraph may be used by several questions

本数据集的文件元信息与数据文件,请前往「数据集文件」页面获取。 当前数据集卡片采用默认模板制作,数据集贡献者未提供更详尽的数据集说明,但您可通过以下Git Clone命令或ModelScope SDK下载该数据集。 #### 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} - 训练集(Training set):31690组问答对(QA pairs) - 开发集(Dev set):4131组问答对(QA pairs) - 测试集(Test set):4957组问答对(QA pairs) - {train/dev/test}_questions: - 包含以下键名的字典列表: - id(整数类型) - paragraph_id(整数类型) - question_text(字符串类型) - answer_text(字符串类型) - answer_start(整数类型) - answer_end(整数类型) - {train/dev/test}_paragraphs: - 字符串列表 - 问答中的paragraph_ids与paragraphs列表中的索引一一对应 - 单个段落可被多个问答引用
提供机构:
maas
创建时间:
2025-07-22
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是李宏毅机器学习2022年春季课程作业7的数据集,包含训练集、开发集和测试集,总计超过4万对问答对,用于机器阅读理解任务。数据格式以问题-段落对为主,问题包含答案位置信息,段落可被多个问题复用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务