tollefj/nor-instruct-combined
收藏Hugging Face2024-02-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tollefj/nor-instruct-combined
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个基于指令的挪威语数据集,由NbAiLab/norwegian-alpaca、RuterNorway/Fleurs-Alpaca-EN-NO和RuterNorway/OpenOrcaNo-15k三个数据集拼接而成。数据集包含两个特征:instruction(指令)和response(响应),均为字符串类型。数据集分为训练集和测试集,训练集包含67,714个样本,测试集包含684个样本。数据集的下载大小为21,130,799字节,总大小为33,284,400字节。
该数据集是一个基于指令的挪威语数据集,由NbAiLab/norwegian-alpaca、RuterNorway/Fleurs-Alpaca-EN-NO和RuterNorway/OpenOrcaNo-15k三个数据集拼接而成。数据集包含两个特征:instruction(指令)和response(响应),均为字符串类型。数据集分为训练集和测试集,训练集包含67,714个样本,测试集包含684个样本。数据集的下载大小为21,130,799字节,总大小为33,284,400字节。
提供机构:
tollefj
原始信息汇总
数据集概述
语言
- 挪威语(nb)
数据集信息
特征
- instruction: 字符串类型
- response: 字符串类型
数据分割
- train:
- 字节数: 32962041
- 样本数: 67714
- test:
- 字节数: 322359
- 样本数: 684
数据大小
- 下载大小: 21130799
- 数据集大小: 33284400
配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
数据来源
- NbAiLab/norwegian-alpaca
- RuterNorway/Fleurs-Alpaca-EN-NO
- RuterNorway/OpenOrcaNo-15k



