NLPC-UOM/MWP_Dataset
收藏Hugging Face2025-03-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NLPC-UOM/MWP_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
MWP-Dataset是一个包含英语、僧伽罗语和泰米尔语的数学应用题数据集。该数据集分为简单和代数两类,每类包含三种语言的数学应用题。适用于神经机器翻译和文本生成任务。
提供机构:
NLPC-UOM
原始信息汇总
MWP-Dataset 概述
数据集名称
- 名称: MWP-Dataset
- 全称: English-Sinhala-Tamil Math Word Problem Dataset
数据集内容
- 文件结构:
- Simple-English.txt: 简单英语数学文字问题
- Simple-Sinhala.txt: 简单僧伽罗语数学文字问题
- Simple-Tamil.txt: 简单泰米尔语数学文字问题
- Algebraic-English.txt: 代数英语数学文字问题
- Algebraic-Sinhala.txt: 代数僧伽罗语数学文字问题
- Algebraic-Tamil.txt: 代数泰米尔语数学文字问题
语言
- 支持语言:
- 僧伽罗语 (si)
- 泰米尔语 (ta)
- 英语 (en)
许可协议
- 许可: MIT
任务类别
- 任务类别:
- 神经机器翻译
- 文本生成



