CRAG_清洗html版
收藏魔搭社区2025-10-15 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/zhaofangkun/CRAG_cleaned
下载链接
链接失效反馈官方服务:
资源简介:
数据集文件元信息以及数据文件,请浏览“数据集文件”页面获取。
当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集
#### 下载方法
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
数据集包含三种类型:
crag_task_1为比赛原始训练集
crag_2735为简单清洗html文本的结果
crag_200为crag_2735的子集
Dataset file metadata and data files can be accessed by browsing the "Dataset Files" page.
The current dataset card utilizes the default template, and the dataset contributors have not furnished more detailed descriptions of the dataset. Nevertheless, you can download the dataset using the following GIT Clone command or ModelScope SDK.
#### Download Method
:modelscope-code[]{type="sdk"}
:modelscope-code[]{type="git"}
The dataset consists of three categories:
crag_task_1: the original training set from the competition
crag_2735: the outcome of simple HTML text cleaning
crag_200: the subset of crag_2735
提供机构:
maas
创建时间:
2024-05-14
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集名为'CRAG_清洗html版',由zhaofangkun提供,采用Apache License 2.0许可证,包含三种类型:原始训练集crag_task_1、经过简单HTML文本清洗的crag_2735及其子集crag_200。用户可通过ModelScope SDK或GIT命令下载,数据集大小为1.00GB,更新于2024年5月14日。
以上内容由遇见数据集搜集并总结生成



