DIFAIR
收藏arXiv2023-10-22 更新2024-06-21 收录
下载链接:
https://github.com/mzakizadeh/difair_public
下载链接
链接失效反馈官方服务:
资源简介:
DIFAIR是一个手工策划的语言建模数据集,旨在同时测量预训练语言模型中的公平性和性能。该数据集包含2506个精心筛选的性别特定和性别中性句子,主要从英文维基百科和Reddit社区中抽取。数据集的创建过程包括从原始文本中抽取句子,然后根据性别相关性进行分类和标注。DIFAIR数据集的应用领域主要集中在评估和减少语言模型中的性别偏见,同时确保模型能够保留和正确使用性别相关的事实信息。
提供机构:
德黑兰高等研究院(TeIAS)
创建时间:
2023-10-22



