five

intelizign/ezxchange-alpaca

收藏
Hugging Face2024-06-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/intelizign/ezxchange-alpaca
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置版本(1.0.0, 2.0.0, 2.1.0, 2.2.0, 3.0.0, 3.2.0),每个版本的特征包括指令(instruction)、输出(output)和输入(input),其中输入的数据类型为float64。某些配置版本还包含了特定的XML配置生成指令和示例。每个配置版本都包含一个训练集(train),并提供了相应的文件路径。数据集的大小和下载大小也随配置版本的不同而有所变化。

The dataset contains multiple configuration versions (1.0.0, 2.0.0, 2.1.0, 2.2.0, 3.0.0, 3.2.0), each with features including instruction, output, and input, where the input is of type float64. Some configuration versions also include specific XML configuration generation instructions and examples. Each configuration version includes a training set (train) and provides the corresponding file paths. The size of the dataset and the download size vary depending on the configuration version.
提供机构:
intelizign
原始信息汇总

数据集详情

配置版本 1.0.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
    • input: 浮点数 (float64)
  • 分割:
    • train:
      • 字节数: 744003
      • 样本数: 1208
  • 下载大小: 185685 字节
  • 数据集大小: 744003 字节

配置版本 2.0.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
    • input: 浮点数 (float64)
    • Generate an export XML configuration for the DocumentRevision object with the following properties doc_id, doc_name, doc_type and Document object with the following properties doc_id, owning_dept, last_modified_date. Use the "Document Revision..." query for extraction and the criteria name as "DocName" and value as "Technical Report". With the RelationRule "DocumentRevision" and its relation "documents_tag".: 字符串
    • <IZExportConfig><QueryRule name="Document Revision..."><Criterion name="DocName" value="Technical Report"/></QueryRule><RelationRule type="DocumentRevision"><Relation type="documents_tag"/></RelationRule><PropertyRule type="DocumentRevision" is_class="true"><Property name="doc_id"/><Property name="doc_name"/><Property name="doc_type"/></PropertyRule><PropertyRule type="Document" is_class="true"><Property name="doc_id"/><Property name="owning_dept"/><Property name="last_modified_date"/></PropertyRule></IZExportConfig>: 字符串
  • 分割:
    • train:
      • 字节数: 791507
      • 样本数: 1246
  • 下载大小: 209342 字节
  • 数据集大小: 791507 字节

配置版本 2.1.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
    • input: 浮点数 (float64)
  • 分割:
    • train:
      • 字节数: 782176
      • 样本数: 1247
  • 下载大小: 194675 字节
  • 数据集大小: 782176 字节

配置版本 2.2.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
    • input: 浮点数 (float64)
  • 分割:
    • train:
      • 字节数: 801558
      • 样本数: 1334
  • 下载大小: 197993 字节
  • 数据集大小: 801558 字节

配置版本 3.0.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
    • input: 浮点数 (float64)
  • 分割:
    • train:
      • 字节数: 1803711
      • 样本数: 2348
  • 下载大小: 411979 字节
  • 数据集大小: 1803711 字节

配置版本 3.2.0

  • 特征:
    • instruction: 字符串
    • output: 字符串
  • 分割:
    • train:
      • 字节数: 1777115
      • 样本数: 2340
  • 下载大小: 407428 字节
  • 数据集大小: 1777115 字节

数据文件路径

  • 配置版本 1.0.0:
    • train: 1.0.0/train-*
  • 配置版本 2.1.0:
    • train: 2.1.0/train-*
  • 配置版本 2.2.0:
    • train: 2.2.0/train-*
  • 配置版本 3.0.0:
    • train: 3.0.0/train-*
  • 配置版本 3.2.0:
    • train: 3.2.0/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作