SRHR_Dataset_Questions_and_Responses

Hugging Face2026-01-27 更新2026-01-28 收录

下载链接：

https://huggingface.co/datasets/shuvoghh/SRHR_Dataset_Questions_and_Responses

下载链接

链接失效反馈

官方服务：

资源简介：

SRHR数据集是一个关于性与生殖健康及权利（SRHR）的问题-回答对精选集合，由BRAC大学的一个学术研究项目开发。该数据集旨在支持在敏感医疗背景下对大型语言模型（LLMs）的系统性评估，特别关注孟加拉语和多语言人群，这些人群中的SRHR话题常被污名化或视为文化禁忌。数据集主要用于作为评估基准，而非训练语料库。每个数据条目包含一个真实世界的SRHR相关用户查询和一个结构化、信息丰富且不带偏见的回答。数据集反映了SRHR相关查询中常见的语言多样性、非正式表达和文化基础。数据集适用于LLM聊天机器人的评估和基准测试、多语言和低资源语言研究、LLM-as-a-Judge研究、人机比较评估以及学术研究。数据集不应用于临床诊断或治疗决策、紧急或危机干预系统、未经专业监督直接部署于医疗环境或生成个性化医疗建议。数据集在开发过程中采取了严格的伦理保护措施，确保无个人身份信息（PII）、匿名化处理、内容为信息性和教育性，并优先考虑安全性、清晰度和文化敏感性。数据集发布在Creative Commons Attribution 4.0 International (CC BY 4.0)许可下。

创建时间：

2026-01-24

原始信息汇总

SRHR Dataset: Questions & Responses 数据集概述

数据集基本信息

数据集名称: SRHR Dataset: Questions & Responses
托管地址: https://huggingface.co/datasets/shuvoghh/SRHR_Dataset_Questions_and_Responses
许可协议: Creative Commons Attribution 4.0 International (CC BY 4.0)
主要语言: 孟加拉语 (bn)

概述

本数据集是一个关于性与生殖健康及权利（SRHR）的问题-回答对精选集合，由BRAC大学的一项学术研究项目开发。其创建目的是支持在敏感的医疗保健背景下对大型语言模型（LLMs）进行系统性评估，特别关注孟加拉语使用者和多语言人群，因为在这些群体中，SRHR话题常被污名化或属于文化禁忌。该数据集主要设计为对话AI系统的评估基准，而非训练语料库。

研究背景

本数据集支持以下论文研究： “Development and Implementation of a Framework for Evaluating Large Language Models in Sexual and Reproductive Health and Rights”（《评估大型语言模型在性与生殖健康及权利领域的框架开发与实施》），BRAC大学计算机科学与工程系（2025年）。数据集支撑了一个基于量规的评估框架，该框架结合了：

自动化的 LLM-as-a-Judge 评分
由医疗专业人士和非专家用户进行的并行人工评估

数据集结构

每个数据条目包含：

问题: 一个现实世界中的SRHR相关用户查询
回答: 一个结构化、信息丰富且不带评判性的答案数据集反映了SRHR相关咨询中常见的语言多样性、非正式措辞和文化背景表达。

预期用途

本数据集适用于：

SRHR领域基于LLM的聊天机器人的评估与基准测试
多语言和低资源语言研究
LLM-as-a-Judge 研究
人机对比评估
学术研究、论文工作及可重复实验

非预期用途

本数据集不得用于：

临床诊断或治疗决策
紧急或危机干预系统
在没有专业监督的情况下直接部署于医疗保健环境
生成个性化医疗建议

伦理考量

鉴于SRHR的敏感性，数据集的开发遵循严格的伦理保障措施：

不包含任何个人可识别信息（PII）
所有问题均已匿名化并脱离具体情境
内容具有信息性、教育性并以权利为基础
明确排除露骨、图像化或有害内容
回答优先考虑安全性、清晰度和文化敏感性强烈建议用户在使用本数据集时应用负责任的AI实践。

已知局限性

数据集设计用于评估，而非覆盖所有SRHR主题
不能替代专业医疗指导
所反映的文化规范主要以南亚/孟加拉为中心

许可信息

本数据集根据知识共享署名 4.0 国际许可协议（CC BY 4.0） 发布。您可以自由分享和改编该数据集，但需进行适当署名。

联系方式

如有学术或研究相关查询，请通过相关的Hugging Face个人资料联系数据集作者。

搜集汇总

数据集介绍

构建方式

在性健康与生殖权利这一敏感领域，该数据集由BRAC大学的研究团队精心构建，旨在为评估大型语言模型提供专业基准。其构建过程严格遵循学术伦理规范，通过收集真实世界中的用户咨询问题，并配以结构化、信息丰富且无偏见的回答，形成一系列问答对。所有内容均经过匿名化处理，剔除了个人身份信息，确保数据既反映孟加拉语使用者的实际表达习惯，又避免了任何可能引发伦理争议的细节。

特点

该数据集的核心特点在于其专注于性健康与生殖权利这一高度敏感且常被污名化的话题，尤其关注孟加拉语及多语言环境下的表达多样性。数据条目涵盖了非正式措辞与文化特定表达，真实模拟了用户在实际咨询中的语言风格。作为评估基准而非训练语料，它特别适用于检验对话式人工智能系统在提供安全、清晰且文化敏感回应方面的能力，并支持自动化评分与人工评估相结合的研究框架。

使用方法

该数据集主要应用于学术研究场景，特别是用于系统性地评估大型语言模型在敏感医疗语境下的表现。研究人员可将其作为基准，开展多语言与低资源语言研究、LLM-as-a-Judge实验以及人机对比评估。在使用时，必须严格遵循其设计初衷，即用于模型评估与学术实验，不得将其用于临床诊断、紧急干预或生成个性化医疗建议，并始终辅以专业的医疗监督与负责任的AI实践。

背景与挑战

背景概述

在性健康与生殖健康及权利（SRHR）领域，由于文化禁忌与社会污名化，相关知识的获取与传播长期面临障碍，尤其在孟加拉语等多语言低资源语境中，这一挑战尤为突出。为系统评估大型语言模型在此敏感医疗对话场景中的表现，BRAC大学计算机科学与工程系于2025年主导创建了SRHR问答数据集。该数据集作为学术研究项目的一部分，旨在构建一个结合自动化评分与人工专业评估的基准框架，以推动对话式人工智能在SRHR教育中的负责任应用，并为多语言健康信息公平性研究提供关键资源。

当前挑战

该数据集致力于应对SRHR领域信息获取的核心挑战：如何在尊重文化敏感性与伦理规范的前提下，为低资源语言群体提供准确、非评判性的健康咨询。构建过程中，研究者需克服多重困难：首先，在确保数据匿名化与去身份化的同时，需真实反映用户查询中的语言多样性及非正式表达；其次，需严格排除具有潜在危害或过于直白的内容，平衡信息的完整性与安全性；此外，数据集主要服务于评估而非训练，其覆盖范围与深度有限，且文化视角集中于南亚地区，这在一定程度上限制了其普适性与临床适用性。

常用场景

经典使用场景

在性健康与生殖权利这一敏感且常受文化禁忌影响的领域，该数据集作为评估基准，为大型语言模型在低资源语言环境下的表现提供了系统化的测试平台。其经典使用场景聚焦于评估对话式人工智能系统处理孟加拉语及多语言SRHR咨询的能力，通过模拟真实用户查询与结构化回答的配对，衡量模型在提供信息性、非评判性回应方面的准确性与文化适宜性。

衍生相关工作

围绕该数据集衍生的经典工作主要集中于“LLM-as-a-Judge”评估范式的拓展与跨文化验证。相关研究借鉴其构建的评估框架，进一步探索了自动化评分与医学专家人工评估在敏感话题上的一致性，并激励了针对其他低资源语言或特定文化背景的类似评估数据集的创建，推动了健康领域对话AI评估方法的标准化与多元化。

数据集最近研究