five

hakeematyab/HealthCareMagicWithSummary-100k

收藏
Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/hakeematyab/HealthCareMagicWithSummary-100k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本预处理和摘要生成任务所需的数据,特征字段包括原始输入(input)、预处理后的输出(preprocessed_output)、摘要后的输入(summarized_input)和摘要后的输出(summarized_output)。数据集分为训练集(train),包含112,165个样本,总大小为160,539,214字节。

This dataset contains data for text preprocessing and summarization tasks, with feature fields including raw input (input), preprocessed output (preprocessed_output), summarized input (summarized_input), and summarized output (summarized_output). The dataset is divided into a training set (train) containing 112,165 samples, with a total size of 160,539,214 bytes.
提供机构:
hakeematyab
原始信息汇总

数据集概述

基本信息

  • 名称: HealthCareMagicWithSummary-100k
  • 描述: hakeematyab/HealthCareMagicWithSummary-100k 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献
  • 创建者: Atyab Hakeem
  • 关键词: 100K - 1M, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
  • URL: HealthCareMagicWithSummary-100k

数据格式

  • 分布:
    • 类型: cr:FileObject

    • 名称: repo

    • 描述: The HF Mirror git repository.

    • 内容URL: repo

    • 编码格式: git+https

    • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default

    • 描述: The underlying Parquet files as converted by HF Mirror (see: parquet).

    • 包含于: repo

    • 编码格式: application/x-parquet

    • 包含: default//.parquet

数据字段

  • 记录集:
    • 类型: cr:RecordSet
    • 名称: default
    • 描述: hakeematyab/HealthCareMagicWithSummary-100k - default subset
    • 字段:
      • 类型: cr:Field

      • 名称: default/input

      • 描述: Column input from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : input
      • 类型: cr:Field

      • 名称: default/preprocessed_output

      • 描述: Column preprocessed_output from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : preprocessed_output
      • 类型: cr:Field

      • 名称: default/summarized_input

      • 描述: Column summarized_input from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : summarized_input
      • 类型: cr:Field

      • 名称: default/summarized_output

      • 描述: Column summarized_output from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取:
          • : summarized_output
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作