AliEdalat/Persian_ChatBot_dataset_Fine_Tuning_Alpaca_Model
收藏Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AliEdalat/Persian_ChatBot_dataset_Fine_Tuning_Alpaca_Model
下载链接
链接失效反馈官方服务:
资源简介:
Persian_ChatBot_dataset_Fine_Tuning_Alpaca_Model数据集是一个用于微调LLaMa模型的波斯语聊天机器人数据集。该数据集基于预处理的alpaca数据集,并使用mt5模型将其翻译成波斯语。数据集包含训练和测试数据,共有2k个示例。为了提高聊天机器人的性能,对特定短语进行了替换。
Persian_ChatBot_dataset_Fine_Tuning_Alpaca_Model数据集是一个用于微调LLaMa模型的波斯语聊天机器人数据集。该数据集基于预处理的alpaca数据集,并使用mt5模型将其翻译成波斯语。数据集包含训练和测试数据,共有2k个示例。为了提高聊天机器人的性能,对特定短语进行了替换。
提供机构:
AliEdalat
原始信息汇总
数据集概述
数据集名称
Persian_ChatBot_dataset_Fine_Tuning_Alpaca_Model
数据集用途
- 用于文本生成任务
- 用于对话任务
数据集语言
波斯语(fa)
数据集大小
1K<n<10K
数据集内容
- 使用预处理的alpaca数据集作为基础数据集,并通过mt5模型将非翻译数据翻译成波斯语。
- 包含训练数据集和测试数据集,总计约2000个示例。
模型使用
- 使用LLaMA作为生成模型,通过波斯语数据集进行微调,以创建聊天机器人模型。



