five

NLPC-UOM/MWP_Dataset

收藏
Hugging Face2025-03-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NLPC-UOM/MWP_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MWP-Dataset是一个包含英语、僧伽罗语和泰米尔语的数学应用题数据集。该数据集分为简单和代数两类,每类包含三种语言的数学应用题。适用于神经机器翻译和文本生成任务。
提供机构:
NLPC-UOM
原始信息汇总

MWP-Dataset 概述

数据集名称

  • 名称: MWP-Dataset
  • 全称: English-Sinhala-Tamil Math Word Problem Dataset

数据集内容

  • 文件结构:
    • Simple-English.txt: 简单英语数学文字问题
    • Simple-Sinhala.txt: 简单僧伽罗语数学文字问题
    • Simple-Tamil.txt: 简单泰米尔语数学文字问题
    • Algebraic-English.txt: 代数英语数学文字问题
    • Algebraic-Sinhala.txt: 代数僧伽罗语数学文字问题
    • Algebraic-Tamil.txt: 代数泰米尔语数学文字问题

语言

  • 支持语言:
    • 僧伽罗语 (si)
    • 泰米尔语 (ta)
    • 英语 (en)

许可协议

  • 许可: MIT

任务类别

  • 任务类别:
    • 神经机器翻译
    • 文本生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作