five

ceselder/loracle-pretrain-qa-v4.1-preview300

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/ceselder/loracle-pretrain-qa-v4.1-preview300
下载链接
链接失效反馈
官方服务:
资源简介:
v4.1预览版300——包含有毒数据合并(250 FFW清洁数据 + 50有毒数据) - 70/20/7/3的主题分割 - T1_detailed结构化qtype(25%的组织获得一个) - 5个多文档问答风格开场白 - has_toxic_doc源自特定来源(redpajama2-toxic / webforum- / toxic-) - 对于单主题组织,跳过T2

v4.1 preview 300 — with toxic merged (250 FFW clean + 50 toxic) - 70/20/7/3 topic split - T1_detailed structured qtype (25% of orgs get one) - 5 multidoc-qa-style openers - has_toxic_doc derived from source (redpajama2-toxic / webforum- / toxic-) - T2 skipped for 1-topic orgs
提供机构:
ceselder
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作