khaled123/Tunisian_Dialectic_English_Derja
收藏Hugging Face2024-10-26 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/khaled123/Tunisian_Dialectic_English_Derja
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个丰富且广泛的突尼斯方言(Derja)和英语翻译的集合,数据来源多样,包括合成翻译、教学数据、媒体转录、社交媒体内容等,更新至2024年10月。数据集结构为JSON文件,每个文件包含一个字典列表,字典中包含`text`字段。数据集可用于翻译、情感分析和文本生成任务。
This dataset is a rich and extensive collection of Tunisian dialectic (Derja) and English translations from various sources, including synthetic translations, instructional data, media transcripts, social media content, and more. The dataset is composed of JSON files, each containing a list of dictionaries with a `text` field. It also includes sentiment analysis examples and text generation samples.
提供机构:
khaled123



