carlosug/end2end_textclassification
收藏数据集卡片 for end2end_textclassification
数据集描述
- 数据集摘要
- 包含一个符合 Argilla 数据集格式的配置文件
argilla.yaml。 - 数据集记录格式兼容 HuggingFace
datasets。 - 包含用于构建和整理数据集的标注指南(如果已在 Argilla 中定义)。
- 包含一个符合 Argilla 数据集格式的配置文件
加载数据集
使用 Argilla 加载
python import argilla as rg
ds = rg.FeedbackDataset.from_huggingface("carlosug/end2end_textclassification")
使用 datasets 加载
python from datasets import load_dataset
ds = load_dataset("carlosug/end2end_textclassification")
支持的任务和排行榜
- 数据集可用于不同的 NLP 任务,具体取决于配置。
- 没有与该数据集关联的排行榜。
数据集结构
数据在 Argilla 中
-
字段 (Fields)
text: 文本类型,必需。
-
问题 (Questions)
label: 标签选择类型,必需,允许值为 [World, Sports, Business, Sci/Tech]。
-
建议 (Suggestions)
- 可选,与现有问题关联,包含建议值及其元数据。
-
元数据 (Metadata)
- 可选,提供关于数据集记录的额外信息。
-
指南 (Guidelines)
- 可选,提供给标注者的指令。
数据实例
-
Argilla 格式 json { "external_id": "record-0", "fields": { "text": "Wall St. Bears Claw Back Into the Black (Reuters) Reuters - Short-sellers, Wall Streets dwindling\band of ultra-cynics, are seeing green again." }, "metadata": {}, "responses": [], "suggestions": [], "vectors": {} }
-
HuggingFace
datasets格式 json { "external_id": "record-0", "label": [], "label-suggestion": null, "label-suggestion-metadata": { "agent": null, "score": null, "type": null }, "metadata": "{}", "text": "Wall St. Bears Claw Back Into the Black (Reuters) Reuters - Short-sellers, Wall Streets dwindling\band of ultra-cynics, are seeing green again." }
数据字段
-
字段 (Fields)
text: 文本类型。
-
问题 (Questions)
label: 标签选择类型,允许值为 [World, Sports, Business, Sci/Tech]。
-
建议 (Suggestions)
- 可选,
label-suggestion: 标签选择类型,允许值为 [World, Sports, Business, Sci/Tech]。
- 可选,
-
元数据 (Metadata)
- 可选,提供关于数据集记录的额外信息。
-
外部 ID (external_id)
- 可选,提供数据集记录的外部 ID。
数据分割
- 数据集包含一个分割:
train。



