five

chethan-mahindrakar/lima_dataset_processed

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/chethan-mahindrakar/lima_dataset_processed
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含150个样本,主要用于训练。每个样本包含对话内容(conversations)、来源(source)和索引级别(__index_level_0__)三个特征。对话内容为字符串序列,来源为字符串,索引级别为int64类型。数据集的文件大小为424964字节,下载大小为257156字节。数据文件路径为data/train-*。

The dataset contains 150 samples, primarily used for training. Each sample includes three features: conversations (a sequence of strings), source (a string), and __index_level_0__ (an int64). The dataset has a file size of 424964 bytes and a download size of 257156 bytes. The data files are located at data/train-*.
提供机构:
chethan-mahindrakar
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • conversations: 字符串序列
    • source: 字符串类型
    • index_level_0: 整数类型
  • 分割:

    • train:
      • 样本数量: 150
      • 字节数: 424964
  • 下载大小: 257156 字节

  • 数据集大小: 424964 字节

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作