ghomasHudson/longdoc_paired_character_id

Name: ghomasHudson/longdoc_paired_character_id
Creator: ghomasHudson
Published: 2023-06-12 10:34:36
License: 暂无描述

Hugging Face2023-06-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/ghomasHudson/longdoc_paired_character_id

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: input dtype: string - name: response_j dtype: string - name: response_k dtype: string splits: - name: train num_bytes: 305164567 num_examples: 458670 download_size: 123573297 dataset_size: 305164567 --- # Dataset Card for "longdoc_paired_character_id" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息：特征字段： - 字段名：输入（input），数据类型：字符串（string） - 字段名：响应j（response_j），数据类型：字符串（string） - 字段名：响应k（response_k），数据类型：字符串（string）数据集划分： - 划分名称：训练集（train），字节大小：305164567，样本数量：458670 下载大小：123573297 数据集总大小：305164567 --- # 「长文档配对字符标识（longdoc_paired_character_id）」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

ghomasHudson

原始信息汇总

数据集概述

数据集名称

longdoc_paired_character_id

数据集特征

input: 数据类型为字符串。
response_j: 数据类型为字符串。
response_k: 数据类型为字符串。

数据集分割

train: 包含458670个样本，总大小为305164567字节。

数据集大小

下载大小: 123573297字节
数据集总大小: 305164567字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集