hakeematyab/HealthCareMagicWithSummary-100k
收藏Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hakeematyab/HealthCareMagicWithSummary-100k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本预处理和摘要生成任务所需的数据,特征字段包括原始输入(input)、预处理后的输出(preprocessed_output)、摘要后的输入(summarized_input)和摘要后的输出(summarized_output)。数据集分为训练集(train),包含112,165个样本,总大小为160,539,214字节。
This dataset contains data for text preprocessing and summarization tasks, with feature fields including raw input (input), preprocessed output (preprocessed_output), summarized input (summarized_input), and summarized output (summarized_output). The dataset is divided into a training set (train) containing 112,165 samples, with a total size of 160,539,214 bytes.
提供机构:
hakeematyab
原始信息汇总
数据集概述
基本信息
- 名称: HealthCareMagicWithSummary-100k
- 描述: hakeematyab/HealthCareMagicWithSummary-100k 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献
- 创建者: Atyab Hakeem
- 关键词: 100K - 1M, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
- URL: HealthCareMagicWithSummary-100k
数据格式
- 分布:
数据字段
- 记录集:
- 类型: cr:RecordSet
- 名称: default
- 描述: hakeematyab/HealthCareMagicWithSummary-100k - default subset
- 字段:
-
类型: cr:Field
-
名称: default/input
-
描述: Column input from the HF Mirror parquet file.
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: input
-
类型: cr:Field
-
名称: default/preprocessed_output
-
描述: Column preprocessed_output from the HF Mirror parquet file.
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: preprocessed_output
-
类型: cr:Field
-
名称: default/summarized_input
-
描述: Column summarized_input from the HF Mirror parquet file.
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: summarized_input
-
类型: cr:Field
-
名称: default/summarized_output
-
描述: Column summarized_output from the HF Mirror parquet file.
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: summarized_output
-



