alfarruggia/wmout
收藏Hugging Face2024-02-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alfarruggia/wmout
下载链接
链接失效反馈官方服务:
资源简介:
这是一个由AI生成的关于健身领域的实体识别数据集,目前仍在开发中。数据集包含四种实体类型:锻炼(workout)、持续时间(duration)、频率(frequency)和数量(number)。数据集的示例展示了训练数据的格式,包括命名实体识别标签(ner_tags)、标识符(id)和分词(tokens)。此外,还提供了标签到ID的映射关系以及数据集的划分情况。
这是一个由AI生成的关于健身领域的实体识别数据集,目前仍在开发中。数据集包含四种实体类型:锻炼(workout)、持续时间(duration)、频率(frequency)和数量(number)。数据集的示例展示了训练数据的格式,包括命名实体识别标签(ner_tags)、标识符(id)和分词(tokens)。此外,还提供了标签到ID的映射关系以及数据集的划分情况。
提供机构:
alfarruggia
原始信息汇总
Workout Motivation Entity Dataset
数据集概述
这是一个由AI生成的、用于健身领域的工作进展中的合成数据集。
- 实体类型:
workout,duration,frequency,number
数据集结构
数据实例
一个train的示例如下:
json
{
"ner_tags": [0, 0, 0, 0, 0, 0, 0, 0, 6, 1, 4, 3, 0, 6, 7],
"id": 0,
"tokens": ["To", "improve", "upper", "body", "strength", ",", "Ill", "include", "90", "Pushup", "twice", "daily", "for", "30", "minutes"]
}
标签ID
标签与ID的对应关系如下: python { 0: 0, 1: B-Workout, 2: I-Workout, 3: I-Frequency, 4: B-Frequency, 5: I-Duration, 6: B-Number, 7: B-Duration }
数据分割
| 名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| wmout | 620 | 78 | 77 |



