hon9kon9ize/yue-alpaca-chat
收藏Hugging Face2024-04-20 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/hon9kon9ize/yue-alpaca-chat
下载链接
链接失效反馈资源简介:
廣東話草泥馬数据集包含由Gemini Pro使用Stanfords Alpaca生成的广东话指令跟随数据,用于微调大型语言模型。请注意,此数据集未经严格验证,内容可能包含错误。
廣東話草泥馬数据集包含由Gemini Pro使用Stanfords Alpaca生成的广东话指令跟随数据,用于微调大型语言模型。请注意,此数据集未经严格验证,内容可能包含错误。
提供机构:
hon9kon9ize
原始信息汇总
数据集概述
基本信息
- 语言: 粤语
- 许可证: CC BY-NC 4.0
- 大小类别: 1K<n<10K
- 标签: sft, alpaca
数据集结构
特征
- prompt: 字符串类型
- prompt_id: 64位整数类型
- messages: 列表类型
- content: 字符串类型
- role: 字符串类型
分割
- train_sft:
- 字节数: 7745440
- 样本数: 16784
- test_sft:
- 字节数: 896051
- 样本数: 1865
大小
- 下载大小: 5222505
- 数据集大小: 8641491
配置
- config_name: default
- 数据文件:
- train_sft: data/train_sft-*
- test_sft: data/test_sft-*
- 数据文件:



