lewiswatson/flag_injected_wikipedia_sample
收藏Hugging Face2024-04-10 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/lewiswatson/flag_injected_wikipedia_sample
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本生成任务的英语数据集,数据规模在10,000到100,000之间。数据集基于Wikipedia的20220301.simple版本,并注入了特定的字符串ltdh{next_word_prediction_chicken},该字符串的出现频率为0.07。
该数据集是一个用于文本生成任务的英语数据集,数据规模在10,000到100,000之间。数据集基于Wikipedia的20220301.simple版本,并注入了特定的字符串ltdh{next_word_prediction_chicken},该字符串的出现频率为0.07。
提供机构:
lewiswatson
原始信息汇总
数据集概述
任务类别
- 文本生成
语言
- 英语
数据集大小
- 10,000 < n < 100,000
数据集描述
- 该数据集基于维基百科的"20220301.simple"版本,并注入了特定的字符串" ltdh{next_word_prediction_chicken} "。
字符串频率
- 0.07



