Atharva07/hc3_finance
收藏Hugging Face2023-10-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atharva07/hc3_finance
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
dataset_info:
features:
- name: id
dtype: string
- name: question
dtype: string
- name: human_answers
dtype: string
- name: chatgpt_answers
sequence: string
- name: source
dtype: string
- name: embeddings
sequence: float32
- name: label
dtype: int64
splits:
- name: train
num_bytes: 12514923
num_examples: 3104
- name: validation
num_bytes: 1655672
num_examples: 414
- name: test
num_bytes: 1696431
num_examples: 415
download_size: 13908983
dataset_size: 15867026
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
许可证:Apache-2.0许可证
数据集信息:
特征字段:
- 字段名:标识符(id),数据类型:字符串
- 字段名:问题(question),数据类型:字符串
- 字段名:人类回答(human_answers),数据类型:字符串
- 字段名:ChatGPT回答(chatgpt_answers),数据类型:字符串序列
- 字段名:来源(source),数据类型:字符串
- 字段名:嵌入向量(embeddings),数据类型:32位浮点序列(float32)
- 字段名:标签(label),数据类型:64位整型
数据集划分:
- 划分集:训练集(train),字节占用量:12514923,样本数量:3104
- 划分集:验证集(validation),字节占用量:1655672,样本数量:414
- 划分集:测试集(test),字节占用量:1696431,样本数量:415
下载总大小:13908983,数据集总存储大小:15867026
配置项:
- 配置名称:默认配置(default),对应数据文件如下:
- 训练集(train):数据路径为data/train-*
- 验证集(validation):数据路径为data/validation-*
- 测试集(test):数据路径为data/test-*
提供机构:
Atharva07
原始信息汇总
数据集概述
数据特征
- id: 字符串类型
- question: 字符串类型
- human_answers: 字符串类型
- chatgpt_answers: 字符串序列
- source: 字符串类型
- embeddings: 浮点数序列
- label: 整数类型
数据分割
- train:
- 字节数: 12514923
- 样本数: 3104
- validation:
- 字节数: 1655672
- 样本数: 414
- test:
- 字节数: 1696431
- 样本数: 415
数据大小
- 下载大小: 13908983 字节
- 数据集大小: 15867026 字节
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*



