saldigioia/Car0GPT
收藏数据集概述
数据集描述
该数据集是为项目 car0fil-001 自动处理的。
语言
数据集的语言代码为 BCP-47 的 en。
数据集结构
数据实例
数据集的一个样本如下:
json [ { "target": 0, "text": "And I remember", "feat_DATE": "2022-09-12T12:29:04", "feat_PLATFORM": null, "feat_Unnamed: 4": null, "feat_Unnamed: 3": null, "feat_Unnamed: 5": null }, { "target": 1, "text": "Throw a lil u201cKurt filips is my dadu201d", "feat_DATE": "2023-03-27T15:36:21", "feat_PLATFORM": null, "feat_Unnamed: 4": null, "feat_Unnamed: 3": null, "feat_Unnamed: 5": null } ]
数据集字段
数据集包含以下字段(也称为“特征”):
json { "target": "ClassLabel(names=[CAROLINE FILIPS, NOT CAROLINE], id=None)", "text": "Value(dtype=string, id=None)", "feat_DATE": "Value(dtype=string, id=None)", "feat_PLATFORM": "Value(dtype=string, id=None)", "feat_Unnamed: 4": "Value(dtype=float64, id=None)", "feat_Unnamed: 3": "Value(dtype=float64, id=None)", "feat_Unnamed: 5": "Value(dtype=float64, id=None)" }
数据集分割
数据集分为训练集和验证集,分割大小如下:
| 分割名称 | 样本数量 |
|---|---|
| train | 689784 |
| valid | 172447 |



