five

DOSA

收藏
arXiv2024-02-24 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.14651v1
下载链接
链接失效反馈
官方服务:
资源简介:
DOSA数据集是由微软研究院印度分院的研究人员通过参与式研究方法创建的,包含615个来自19个印度地理亚文化的社会文物。该数据集旨在评估大型语言模型对本地社会文化背景的了解和适应性。通过游戏化框架,收集了这些文物的名称和描述,确保描述与该文化个体共享的感觉相一致。DOSA数据集的应用领域包括评估语言模型在不同文化背景下的表现,以及促进对非西方文化的理解和尊重,旨在解决全球数据集中的文化偏见和不平等。
提供机构:
微软研究院印度分院
创建时间:
2024-02-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作