sw-ground-truth
收藏Hugging Face2026-03-18 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/juakazike/sw-ground-truth
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含多维度标注的文本数据集,主要用于分析和研究文本中的偏见、刻板印象及相关特征。数据集包含55,014条训练样本和9,709条测试样本,总大小约75MB。每条数据记录包含丰富的元数据字段,包括语言、国家/地区、方言、来源类型、采集日期等基础信息,以及文本内容、领域、主题等语义信息。特别地,数据集还标注了敏感特征、目标性别、偏见标签、刻板印象类别、显性程度、对指代对象的情感倾向等与偏见分析相关的特征。此外,还包含数据安全标志、个人身份信息移除状态、标注者ID、QA状态等技术性字段。数据集适用于自然语言处理中的偏见检测、内容安全分析、社会语言学研究和相关机器学习任务。
创建时间:
2026-03-05



