derenrich/wikidata-en-descriptions-small
收藏Hugging Face2023-08-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derenrich/wikidata-en-descriptions-small
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含Wikidata英文描述的数据集(下采样版本),数据集的特征包括输出、qid、名称、输入、指令和文本,所有特征的数据类型均为字符串。数据集包含一个训练分割,包含1,560,888个示例,总大小为1,854,503,569字节。数据集的下载大小为1,048,410,730字节。数据集的语言为英语,标签包括wikidata和wikipedia,数据集的规模在1M到10M之间。
这是一个包含Wikidata英文描述的数据集(下采样版本),数据集的特征包括输出、qid、名称、输入、指令和文本,所有特征的数据类型均为字符串。数据集包含一个训练分割,包含1,560,888个示例,总大小为1,854,503,569字节。数据集的下载大小为1,048,410,730字节。数据集的语言为英语,标签包括wikidata和wikipedia,数据集的规模在1M到10M之间。
提供机构:
derenrich
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-3.0
- 数据集名称: Wikidata English descriptions dataset (downsampled)
- 语言: 英语 (en)
- 标签:
- wikidata
- wikipedia
数据结构
- 特征:
- output: 字符串
- qid: 字符串
- name: 字符串
- input: 字符串
- instruction: 字符串
- text: 字符串
数据分割
- 训练集:
- 示例数量: 1560888
- 数据大小: 1854503569 字节
数据大小
- 下载大小: 1048410730 字节
- 数据集大小: 1854503569 字节
数据集类别
- 规模: 100万至1000万之间



