harryph/vn_books_main
收藏Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/harryph/vn_books_main
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个越南语故事的特征信息,涵盖了故事的类别、作者、名称、来源、文本内容以及多种故事类型的标签。数据集分为训练集,包含19900个样本,总大小为217350477字节。
This dataset contains feature information of multiple Vietnamese stories, including categories, authors, story names, sources, text content, and labels for various story types. The dataset is divided into a training set, containing 19,900 samples with a total size of 217,350,477 bytes.
提供机构:
harryph
原始信息汇总
数据集概述
数据集信息
特征
- Id: 类型为
int64 - Thể loại: 类型为
string - Tác giả: 类型为
string - Tên truyện: 类型为
string - Nguồn: 类型为
string - Text: 类型为
string - Truyện Ngắn: 类型为
int64 - Truyện Dài: 类型为
int64 - Biên Khảo, Tùy Bút, Tản Văn: 类型为
int64 - Lịch Sử, Dã Sử: 类型为
int64 - Thần Thoại, Cổ Tích: 类型为
int64 - Kiếm Hiệp: 类型为
int64 - Trung Hoa: 类型为
int64 - Hài Hước, Tiếu Lâm: 类型为
int64 - Khoa Học, Kỹ Thuật: 类型为
int64 - Teen, Tuổi Hoa, Thiếu Nhi: 类型为
int64 - Kinh Dị, Ma Quái: 类型为
int64 - Trinh Thám, Hình Sự: 类型为
int64 - Cổ Văn Việt Nam: 类型为
int64 - Tập Truyện Ngắn: 类型为
int64 - Suy Ngẫm, Làm Người: 类型为
int64 - Nhân Vật, Chân Dung: 类型为
int64 - Triết Học, Kinh Tế: 类型为
int64 - Y Học, Sức Khỏe: 类型为
int64 - Tình Cảm, Lãng Mạn: 类型为
int64 - Phiêu Lưu, Mạo Hiểm: 类型为
int64 - Hồi Ký, Tự Truyện: 类型为
int64 - Kinh Điển: 类型为
int64 - Tiểu Thuyết: 类型为
int64 - Tôn Giáo, Chính Trị: 类型为
int64 - Truyện Tranh: 类型为
int64 - Cuộc Chiến Vn: 类型为
int64 - Kịch, Kịch Bản: 类型为
int64 - Khoa Học Huyền Bí: 类型为
int64 - Khoa Học, Giả Tưởng: 类型为
int64 - Tiên Hiệp: 类型为
int64 - Tâm Lý, Xã Hội, Hiện Thực: 类型为
int64 - Phóng Sự, Điều Tra: 类型为
int64 - Thơ, Trường Ca: 类型为
int64 - Văn Học Miền Nam Trước 75: 类型为
int64 - Nhiều chương: 类型为
bool
数据分割
- train: 包含 19900 个样本,占用 217350477 字节
数据集大小
- 下载大小: 110967582 字节
- 数据集大小: 217350477 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



