five

maghwa/OpenHermes-2-AR-10K-26-680k-690k

收藏
Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/maghwa/OpenHermes-2-AR-10K-26-680k-690k
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: language dtype: 'null' - name: system_prompt dtype: 'null' - name: conversations dtype: string - name: category dtype: 'null' - name: id dtype: 'null' - name: topic dtype: 'null' - name: hash dtype: 'null' - name: model_name dtype: 'null' - name: idx dtype: 'null' - name: skip_prompt_formatting dtype: 'null' - name: model dtype: 'null' - name: avatarUrl dtype: 'null' - name: title dtype: 'null' - name: views dtype: float64 - name: source dtype: string - name: custom_instruction dtype: 'null' splits: - name: train num_bytes: 25324996 num_examples: 10001 download_size: 11501943 dataset_size: 25324996 configs: - config_name: default data_files: - split: train path: data/train-* ---

The dataset includes multiple features such as language, system prompt, conversations, category, ID, topic, hash, model name, index, skip prompt formatting, model, avatar URL, title, views, source, and custom instruction. Among these, conversations and source are string types, views are float64 type, and the data types of other features are null. The dataset is divided into a training set, containing 10001 samples, with a total size of 25324996 bytes. The download size of the dataset is 11501943 bytes.
提供机构:
maghwa
原始信息汇总

数据集概述

数据集信息

特征

  • language: 数据类型为 null
  • system_prompt: 数据类型为 null
  • conversations: 数据类型为 string
  • category: 数据类型为 null
  • id: 数据类型为 null
  • topic: 数据类型为 null
  • hash: 数据类型为 null
  • model_name: 数据类型为 null
  • idx: 数据类型为 null
  • skip_prompt_formatting: 数据类型为 null
  • model: 数据类型为 null
  • avatarUrl: 数据类型为 null
  • title: 数据类型为 null
  • views: 数据类型为 float64
  • source: 数据类型为 string
  • custom_instruction: 数据类型为 null

数据分割

  • train: 包含 10001 个样本,占用 25324996 字节

数据集大小

  • 下载大小: 11501943 字节
  • 数据集大小: 25324996 字节

配置

  • default: 包含训练数据文件,路径为 data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作