GitBag/amazon_movie_tv_llama_mxbai_v8

Name: GitBag/amazon_movie_tv_llama_mxbai_v8
Creator: GitBag
Published: 2024-07-08 06:51:43
License: 暂无描述

Hugging Face2024-07-08 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/GitBag/amazon_movie_tv_llama_mxbai_v8

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，包括会话内的项目索引、会话外的项目索引、密集会话输入、密集会话输出、会话描述、会话描述的LLaMA编码、参考响应、参考响应的MXBAI编码以及索引。数据集分为训练集和测试集，训练集包含14698个示例，测试集包含2784个示例。数据集的下载大小为63927294字节，总大小为3253148738字节。

The dataset includes multiple features such as in-session item indices, out-session item indices, dense session inputs, dense session outputs, session descriptions, LLaMA encoded session descriptions, reference responses, MXBAI encoded reference responses, and indices. The dataset is divided into a training set with 14698 examples and a test set with 2784 examples. The download size of the dataset is 63927294 bytes, and the total size is 3253148738 bytes.

提供机构：

GitBag

原始信息汇总

数据集概述

数据集特征

in_sess_item_idxs: 序列类型，数据类型为int64。
out_sess_item_idxs: 序列类型，数据类型为int64。
dense_in_sesses: 序列类型，数据类型为float64。
dense_out_sesses: 序列类型，数据类型为float64。
sess_descriptions: 数据类型为string。
sess_description_llama: 序列类型，数据类型为int64。
ref_responses: 数据类型为string。
ref_response_mxbai: 序列类型，数据类型为int64。
index: 数据类型为int64。

数据集分割

train: 包含14698个样本，占用2735080521字节。
test: 包含2784个样本，占用518068217字节。

数据集大小

下载大小: 63927294字节。
总数据集大小: 3253148738字节。

配置

default:
- train: 数据文件路径为data/train-*。
- test: 数据文件路径为data/test-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集