IlyaGusev/yandex_q_full
收藏Hugging Face2023-03-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/IlyaGusev/yandex_q_full
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: id2
dtype: int64
- name: title
dtype: string
- name: text_plain
dtype: string
- name: text_html
dtype: string
- name: author
dtype: string
- name: negative_votes
dtype: int32
- name: positive_votes
dtype: int32
- name: quality
dtype: int8
- name: views
dtype: uint64
- name: votes
dtype: int32
- name: approved_answer
dtype: string
- name: timestamp
dtype: uint64
- name: tags
sequence: string
- name: answers
sequence:
- name: id
dtype: string
- name: id2
dtype: int64
- name: text_plain
dtype: string
- name: text_html
dtype: string
- name: author
dtype: string
- name: negative_votes
dtype: int32
- name: positive_votes
dtype: int32
- name: votes
dtype: int32
- name: quality
dtype: int8
- name: views
dtype: uint64
- name: reposts
dtype: int32
- name: timestamp
dtype: uint64
splits:
- name: train
num_bytes: 5468460217
num_examples: 1297670
download_size: 1130317937
dataset_size: 5468460217
---
Based on https://huggingface.co/datasets/its5Q/yandex-q, parsed full.jsonl.gz
提供机构:
IlyaGusev
原始信息汇总
数据集特征
主数据集特征
- id: 字符串类型
- id2: 整数类型,64位
- title: 字符串类型
- text_plain: 字符串类型
- text_html: 字符串类型
- author: 字符串类型
- negative_votes: 整数类型,32位
- positive_votes: 整数类型,32位
- quality: 整数类型,8位
- views: 无符号整数类型,64位
- votes: 整数类型,32位
- approved_answer: 字符串类型
- timestamp: 无符号整数类型,64位
- tags: 序列类型,字符串
子数据集特征(answers)
- id: 字符串类型
- id2: 整数类型,64位
- text_plain: 字符串类型
- text_html: 字符串类型
- author: 字符串类型
- negative_votes: 整数类型,32位
- positive_votes: 整数类型,32位
- votes: 整数类型,32位
- quality: 整数类型,8位
- views: 无符号整数类型,64位
- reposts: 整数类型,32位
- timestamp: 无符号整数类型,64位
数据集分割
- train:
- 数据量: 5468460217 字节
- 示例数量: 1297670
数据集大小
- 下载大小: 1130317937 字节
- 数据集大小: 5468460217 字节



