ReBatch/ultrachat_200k_nl
收藏Hugging Face2024-05-30 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/ReBatch/ultrachat_200k_nl
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是HuggingFaceH4/ultrachat_200K的翻译版本,使用了MarianMT模型进行翻译。它包含了用户和助手之间的多轮对话。
该数据集是HuggingFaceH4/ultrachat_200K的翻译版本,使用了MarianMT模型进行翻译。它包含了用户和助手之间的多轮对话。
提供机构:
ReBatch
原始信息汇总
数据集概述
数据集名称
ultrachat_400k_nl
许可证
apache-2.0
数据集特征
- prompt: 字符串类型
- prompt_id: 字符串类型
- messages: 列表类型,包含以下子特征:
- content: 字符串类型
- original: 字符串类型
- role: 字符串类型
数据集分割
- train: 包含207858个样本,总大小为2283949826字节
- test: 包含23106个样本,总大小为256744046字节
数据集大小
- 下载大小: 1328094001字节
- 数据集总大小: 2540693872字节
配置文件
- config_name: default
- data_files:
- split: train, path: data/train-*
- split: test, path: data/test-*



