qazi-ali/llama_2-product-titles-esci-sft-train
收藏Hugging Face2023-08-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/qazi-ali/llama_2-product-titles-esci-sft-train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: index
dtype: int64
- name: query
dtype: string
- name: text
dtype: string
- name: label
dtype: string
- name: preds
dtype: string
- name: average_score
dtype: float64
- name: total_score
dtype: float64
- name: max_score
dtype: float64
- name: min_score
dtype: float64
- name: best_title
dtype: string
- name: clean_preds
dtype: string
- name: new_score
dtype: float64
- name: good_pred
dtype: bool
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 3113141
num_examples: 3030
download_size: 1632974
dataset_size: 3113141
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "llama_2-product-titles-esci-sft-train"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:索引(index),数据类型:64位整数(int64)
- 名称:查询(query),数据类型:字符串(string)
- 名称:文本(text),数据类型:字符串(string)
- 名称:标签(label),数据类型:字符串(string)
- 名称:预测结果(preds),数据类型:字符串(string)
- 名称:平均得分(average_score),数据类型:64位浮点数(float64)
- 名称:总得分(total_score),数据类型:64位浮点数(float64)
- 名称:最高得分(max_score),数据类型:64位浮点数(float64)
- 名称:最低得分(min_score),数据类型:64位浮点数(float64)
- 名称:最优标题(best_title),数据类型:字符串(string)
- 名称:清洗后预测结果(clean_preds),数据类型:字符串(string)
- 名称:新得分(new_score),数据类型:64位浮点数(float64)
- 名称:有效预测(good_pred),数据类型:布尔型(bool)
- 名称:索引层级0(__index_level_0__),数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train),占用字节数:3113141,样本数量:3030
下载大小:1632974,数据集总大小:3113141
配置项:
- 配置名称:默认配置(default),数据文件:
- 划分:训练集(train),数据路径:data/train-*
# "llama_2-product-titles-esci-sft-train"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
qazi-ali
原始信息汇总
数据集概述
数据集信息
特征
- index: 数据类型为
int64 - query: 数据类型为
string - text: 数据类型为
string - label: 数据类型为
string - preds: 数据类型为
string - average_score: 数据类型为
float64 - total_score: 数据类型为
float64 - max_score: 数据类型为
float64 - min_score: 数据类型为
float64 - best_title: 数据类型为
string - clean_preds: 数据类型为
string - new_score: 数据类型为
float64 - good_pred: 数据类型为
bool - index_level_0: 数据类型为
int64
分割
- train: 包含 3030 个样本,占用 3113141 字节
大小
- 下载大小: 1632974 字节
- 数据集大小: 3113141 字节
配置
- default: 包含训练数据文件,路径为
data/train-*



