five

main-horse/ffv4_dataset_test

收藏
Hugging Face2023-07-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/main-horse/ffv4_dataset_test
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于未来模型测试的测试数据集,包含id、header和story三个特征。数据集没有训练/测试分割,所有数据都在一个名为‘everything’的分割中。文件中提供了加载和使用数据集的代码示例,并展示了数据集的预期输出格式。
提供机构:
main-horse
原始信息汇总

数据集概述

数据集基本信息

  • 许可证: openrail
  • 数据集大小: 4112502210字节
  • 下载大小: 2446111268字节
  • 样本数量: 52357

数据集特征

  • id: 整数型(int32)
  • header: 字符串型(string)
  • story: 字符串型(string)

数据集划分

  • 划分名称: everything
  • 字节数: 4112502210字节
  • 样本数: 52357

数据集使用示例

  • 加载数据集示例: python import datasets ds = datasets.load_dataset(./dataset_code.py, name=notebook_defaults_ratio0.8_likes10)

  • 数据集操作示例: python ds_real = ds[everything] one_item = ds_real[0] one_item_truncuated = one_item | {story: one_item[story][:1000]} print(one_item_truncuated)

数据集结构

  • 数据集结构: DatasetDict
    • everything: Dataset
      • 特征: [id, header, story]
      • 行数: 52357
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作