five

SCUT-DLVCLab/WenMind

收藏
Hugging Face2025-02-07 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/SCUT-DLVCLab/WenMind
下载链接
链接失效反馈
官方服务:
资源简介:
WenMind基准是一个面向中文古典文学与语言艺术的大型语言模型评估数据集,包含古文、古诗和古代文学文化三个子领域,涵盖42个细粒度任务,包括填空题、选择题和问答题三种问题格式,适用于领域导向和能力导向两种评估场景。

WenMind Benchmark is a comprehensive evaluation dataset for Large Language Models (LLMs) in the domain of Chinese Classical Literature and Language Arts, covering sub-domains of Ancient Prose, Ancient Poetry, and Ancient Literary Culture, with 42 fine-grained tasks, including three question formats (Fill-in-the-Blank, Multiple-Choice, and Question-and-Answer) and two evaluation scenarios (domain-oriented and capability-oriented).
提供机构:
SCUT-DLVCLab
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
WenMind是一个针对中文古典文学与语言艺术的大型语言模型评估数据集,包含古文、古诗和古代文学文化三个子领域,涵盖42个细粒度任务,采用填空题、选择题和问答题三种格式,适用于领域导向和能力导向的评估场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作