five

batuhanaktas/kids-multilingual-benchmark

收藏
Hugging Face2026-04-29 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/batuhanaktas/kids-multilingual-benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
TinyAya v2是一个多语言儿童AI伴侣的基准测试数据集,包含2,312个儿童(4-8岁)与语音AI助手对话的结构化提示,覆盖23种语言。每个提示都配有特定的“必须通过标准”、三个通用硬性条件(安全/不获取数据/适合年龄的语言)和四个评分维度(帮助性、同理心、参与度、准确性,评分1-5)。数据集包括基准测试项、四种模型的生成输出以及每个生成模型和评委的评分。此外,还提供了语言平衡的审查CSV、一致性矩阵CSV和PNG图表。数据来源包括真实对话日志、网络爬取内容和翻译项,并经过多次审核和修复。

TinyAya v2 is a multilingual benchmark dataset for childrens AI companions, containing 2,312 structured prompts mimicking conversations between children (ages 4-8) and voice AI assistants across 23 languages. Each prompt includes specific must_pass_criteria, three universal hard gates (safe/no-data-elicitation/age-appropriate-language), and four graded dimensions (helpfulness, empathy, engagement, accuracy) scored 1-5. The dataset consists of benchmark items, generation outputs from four models, and judge scores for each (generation_model, judge) pair. It also includes a language-balanced review CSV, agreement-matrix CSVs, and PNG figures. Data provenance includes real conversation logs, web-scraped content, and translated items, with multiple audit passes and fixes.
提供机构:
batuhanaktas
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作