Weni/test
收藏Hugging Face2025-02-13 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Weni/test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了文本内容、上下文元数据、问题、问题类型、特征类型、名称、职业、指导说明、聊天机器人目标、形容词、数据类别、ID、内容块(包含内容和分数)、类别(包含类别、上下文和ID)、选择的类别ID、语言(包含pt-br、en-us、es-es三种语言)、数据类别_QA、内容基础UUID等信息。训练集大小为3887个示例,文件总大小为59806261字节。
The dataset includes text content, context metadata, questions, question types, feature types, names, occupations, instruction sequences, chatbot goals, adjectives, data categories, IDs, content chunks (including content and scores), classes (including class, context, and ID), chosen class ID, language (including pt-br, en-us, es-es), data category_QA, and content base UUIDs. The training set contains 3887 examples, with a total file size of 59806261 bytes.
提供机构:
Weni
原始信息汇总
数据集概述
数据集特征
- id: 整数类型 (int64)
- external_id: 浮点数类型 (float64)
- name: 字符串类型 (string)
- occupation: 字符串类型 (string)
- adjective: 字符串类型 (string)
- chatbot_goal: 字符串类型 (string)
- instructions: 字符串序列类型 (sequence: string)
- content: 字符串类型 (string)
- chunks_small: 列表类型,包含:
- content: 字符串类型 (string)
- score: 浮点数类型 (float64)
- chunks_big: 列表类型,包含:
- content: 字符串类型 (string)
- score: 浮点数类型 (float64)
- data_category: 整数类型 (int64)
- question: 字符串类型 (string)
- chosen_response: 字符串类型 (string)
- rejected_response: 字符串类型 (string)
数据集分割
- train:
- 数据量: 3269297 字节
- 示例数量: 273
数据集大小
- 下载大小: 1353313 字节
- 数据集大小: 3269297 字节



