中医文献问题生成数据集
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/86895
下载链接
链接失效反馈官方服务:
资源简介:
本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料。每篇文档由人工标注产生1~4对(问题, 答案)对。
This dataset is sourced from the Tianchi Traditional Chinese Medicine (TCM) Question Generation Competition: https://tianchi.aliyun.com/competition/entrance/531826/information. The TCM literature question generation dataset contains 3500 documents. Each document is manually annotated to generate 1 to 4 (question, answer) pairs.
提供机构:
阿里云天池
创建时间:
2020-12-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个专注于中医药领域的问题生成数据集,包含3500篇语料,每篇文档由人工标注产生1到4对(问题,答案)对,总计13000对数据。数据来源于《黄帝内经翻译版》等四个中医药文本来源,问题类型包括实体类和描述类,答案是从段落中提取的连续文本片段,适用于自然语言处理中的问题生成任务研究。
以上内容由遇见数据集搜集并总结生成



