fhaddad/autotrain-data-fhdd_arabic_chatbot
收藏AutoTrain Dataset for project: fhdd_arabic_chatbot
数据集描述
该数据集是为项目 fhdd_arabic_chatbot 自动处理而成。
语言
数据集的语言BCP-47代码为 en2ar。
数据集结构
数据实例
数据集样例如下:
json [ { "feat_sourceLang": "ara", "feat_targetlang": "eng", "target": "u064au0646u0628u063au064a u0623u0646 u062au064fu0638u0647u0631 u0627u0644u0646u0651u0633u0627u0621 u0648u062cu0648u0647u0647u0646u0651.", "source": "Women should have their faces visible." }, { "feat_sourceLang": "ara", "feat_targetlang": "eng", "target": "u0623u062au062fu0631u0633 u0627u0644u0625u0646u062cu0644u064au0632u064au0629u061f", "source": "Do you study English?" } ]
数据集字段
数据集包含以下字段:
json { "feat_sourceLang": "Value(dtype=string, id=None)", "feat_targetlang": "Value(dtype=string, id=None)", "target": "Value(dtype=string, id=None)", "source": "Value(dtype=string, id=None)" }
数据集分割
数据集分为训练集和验证集,分割大小如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练 | 15622 |
| 验证 | 3906 |



