fhasan85/bengali-prompts
收藏Hugging Face2023-06-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fhasan85/bengali-prompts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了从2023年2月25日至2023年6月4日期间,人们在Alapchari平台上提出的提示和问题,主要用于孟加拉语语言模型的开发和评估。数据集提供了35218个独特的提示,为研究者提供了一个使用来自孟加拉国的真实世界数据评估其语言模型的独特机会。数据集目前按字符串长度从短到长排序,且大多数优质问题位于中间部分。
该数据集包含了从2023年2月25日至2023年6月4日期间,人们在Alapchari平台上提出的提示和问题,主要用于孟加拉语语言模型的开发和评估。数据集提供了35218个独特的提示,为研究者提供了一个使用来自孟加拉国的真实世界数据评估其语言模型的独特机会。数据集目前按字符串长度从短到长排序,且大多数优质问题位于中间部分。
提供机构:
fhasan85
原始信息汇总
数据集概述
数据集名称
Dataset for evaluating language model using real world Bengali data
数据集内容
- 数据来源:Alapchari
- 数据类型:35218个独特的提示和问题
- 数据收集时间:2023年2月25日至2023年6月4日
- 数据用途:用于开发和评估孟加拉语语言模型
数据集特点
- 语言:孟加拉语(bn)
- 许可证:openrail
- 排序方式:目前按字符串长度从小到大排序,优质问题多集中在中段



