hllj/vi_gsm8k
收藏Hugging Face2023-12-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hllj/vi_gsm8k
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-generation
- text2text-generation
language:
- vi
pretty_name: Vietnamese Translation of Grade School Math 8K Dataset
size_categories:
- 1K<n<10K
---
# Dataset Card for Vietnamese Translation of Grade School Math 8K Dataset
## Dataset Summary
This is a dataset translated from the original GSM8K dataset using GPT-3.5 to perform the translation task and tested by us.
You can see the original [dataset in English](https://huggingface.co/datasets/gsm8k) for more details
## Language
The language in the dataset is translated into Vietnamese, however some units such as currency or personal names are kept the same.
## Dataset Structure
The data set has been slightly edited compared to the original GMS8K data, we separated the questions, explanations, and answers into different fields.
```python
{
"index": 0,
"question": "Natalia đã bán kẹp tóc cho 48 người bạn của cô ấy vào tháng 4, và sau đó cô ấy đã bán nửa số lượng kẹp tóc đó vào tháng 5. Natalia đã bán tổng cộng bao nhiêu kẹp tóc trong tháng 4 và tháng 5?",
"explanation": "Natalia đã bán 24 kẹp trong tháng 5.\nNatalia đã bán tổng cộng 72 kẹp trong tháng 4 và tháng 5.",
"answer": "72"
}
```
In addition, we have not translated the accompanying question parts from the GMS8K socratic dataset. You can see them in more detail in [GSM8K's Github here](https://github.com/openai/grade-school-math/tree/master/grade_school_math/data).
We still welcome your contributions to this dataset.
## Data Fields
The current data set structure includes the fields:
- index: numerical order.
- question: string for the content of a mathematical question.
- explanation: string for explanation to the question.
- answer: a single value to answer to the question.
提供机构:
hllj
原始信息汇总
越南语版小学数学8K数据集概述
数据集总结
这是一个基于GPT-3.5翻译自原始GSM8K数据集的越南语版本,并经过我们的测试。
语言
数据集中的语言被翻译成越南语,但一些单位如货币或人名保持不变。
数据集结构
与原始GMS8K数据相比,数据集进行了轻微编辑,将问题、解释和答案分成了不同的字段。
python { "index": 0, "question": "Natalia đã bán kẹp tóc cho 48 người bạn của cô ấy vào tháng 4, và sau đó cô ấy đã bán nửa số lượng kẹp tóc đó vào tháng 5. Natalia đã bán tổng cộng bao nhiêu kẹp tóc trong tháng 4 và tháng 5?", "explanation": "Natalia đã bán 24 kẹp trong tháng 5. Natalia đã bán tổng cộng 72 kẹp trong tháng 4 và tháng 5.", "answer": "72" }
数据字段
当前数据集结构包括以下字段:
- index: 数字顺序。
- question: 数学问题的内容。
- explanation: 问题的解释。
- answer: 问题的答案。



