DOSA
收藏arXiv2024-02-24 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.14651v1
下载链接
链接失效反馈官方服务:
资源简介:
DOSA数据集是由微软研究院印度分院的研究人员通过参与式研究方法创建的,包含615个来自19个印度地理亚文化的社会文物。该数据集旨在评估大型语言模型对本地社会文化背景的了解和适应性。通过游戏化框架,收集了这些文物的名称和描述,确保描述与该文化个体共享的感觉相一致。DOSA数据集的应用领域包括评估语言模型在不同文化背景下的表现,以及促进对非西方文化的理解和尊重,旨在解决全球数据集中的文化偏见和不平等。
提供机构:
微软研究院印度分院
创建时间:
2024-02-24



