loubnabnl/comments_preceding_bots
收藏Hugging Face2023-02-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/loubnabnl/comments_preceding_bots
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: events
list:
- name: action
dtype: string
- name: author
dtype: string
- name: comment_id
dtype: float64
- name: datetime
dtype: int64
- name: text
dtype: string
- name: title
dtype: string
- name: type
dtype: string
- name: data_with_bots
list:
- name: bot
dtype: string
- name: previous
struct:
- name: meta
dtype: string
- name: text
dtype: string
- name: data_without_bots
list:
- name: previous
struct:
- name: meta
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 286942.17
num_examples: 183
download_size: 236154
dataset_size: 286942.17
---
# Dataset Card for "comments_preceding_bots"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 名称:events(事件列表),类型为列表,每个列表元素为结构体,包含以下字段:
- 字段名:action(操作动作),数据类型:字符串(string)
- 字段名:author(作者),数据类型:字符串(string)
- 字段名:comment_id(评论ID),数据类型:float64
- 字段名:datetime(时间戳),数据类型:int64
- 字段名:text(文本内容),数据类型:字符串(string)
- 字段名:title(标题),数据类型:字符串(string)
- 字段名:type(类型),数据类型:字符串(string)
- 名称:data_with_bots(含机器人数据),类型为列表,每个列表元素为结构体,包含以下字段:
- 字段名:bot(机器人),数据类型:字符串(string)
- 字段名:previous(前置内容),类型为结构体,包含:
- 字段名:meta(元数据),数据类型:字符串(string)
- 字段名:text(文本内容),数据类型:字符串(string)
- 名称:data_without_bots(无机器人数据),类型为列表,每个列表元素为结构体,包含以下字段:
- 字段名:previous(前置内容),类型为结构体,包含:
- 字段名:meta(元数据),数据类型:字符串(string)
- 字段名:text(文本内容),数据类型:字符串(string)
数据集划分:
- 划分名称:train(训练集),字节占用量:286942.17,样本总数:183
下载大小:236154,数据集总大小:286942.17
# "机器人前置评论"数据集卡片 (Dataset Card)
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
loubnabnl
原始信息汇总
数据集概述
数据集特征
事件数据(events)
- action:字符串类型
- author:字符串类型
- comment_id:浮点数类型
- datetime:整数类型
- text:字符串类型
- title:字符串类型
- type:字符串类型
包含机器人的数据(data_with_bots)
- bot:字符串类型
- previous:结构体类型,包含:
- meta:字符串类型
- text:字符串类型
不包含机器人的数据(data_without_bots)
- previous:结构体类型,包含:
- meta:字符串类型
- text:字符串类型
数据集分割
- 训练集(train)
- 数据大小:286942.17字节
- 示例数量:183
数据集大小
- 下载大小:236154字节
- 数据集大小:286942.17字节



