five

Ichsan2895/alpaca-gpt4-indonesian

收藏
Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Ichsan2895/alpaca-gpt4-indonesian
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个问答任务相关的数据集,使用印尼语(ID)编写,规模在10K到100K之间。数据集格式从原始的JSON格式转换为input和output的表格格式,以便于使用。例如,原始格式中的from和value字段被转换为input和output列。
提供机构:
Ichsan2895
原始信息汇总

数据集概述

许可证

  • CC BY-SA 4.0

语言

  • 印度尼西亚语

数据集大小

  • 10K < n < 100K

任务类别

  • 问答

数据格式转换

  • 原始数据集格式被调整为 input 和 output 格式。

示例

  • 转换前: json [ { "from": "human", "value": "Saranlah slogan untuk kampanye daur ulang " }, { "from": "gpt", "value": "1. "Kurangi, gunakan kembali, daur ulang: Bersama untuk masa depan yang lebih hijau."
  1. "Daur ulanglah hari ini, untuk masa depan yang lebih baik."
  2. "Ubah sampahmu menjadi harta karun - Daur ulang!"
  3. "Daur ulang untuk siklus kehidupan."
  4. "Simpan sumber daya, daur ulang lebih banyak."" } ]
  • 转换后:
    input output
    Saranlah slogan untuk kampanye daur ulang

| 1. "Kurangi, gunakan kembali, daur ulang: Bersama untuk masa depan yang lebih hijau." 2. "Daur ulanglah hari ini, untuk masa depan yang lebih baik." 3. "Ubah sampahmu menjadi harta karun - Daur ulang!" 4. "Daur ulang untuk siklus kehidupan." 5. "Simpan sumber daya, daur ulang lebih banyak. |

引用

  • Instruction Tuning with GPT-4 plaintext @article{peng2023instruction, title={Instruction Tuning with GPT-4}, author={Peng, Baolin and Li, Chunyuan and He, Pengcheng and Galley, Michel and Gao, Jianfeng}, journal={arXiv preprint arXiv:2304.03277}, year={2023} }

  • MultilingualSIFT: Multilingual Supervised Instruction Fine-tuning plaintext @software{Chen_MultilingualSIFT_Multilingual_Supervised_2023, author = {Chen, Zhihong and Yan, Shuo and Liang, Juhao and Jiang, Feng and Wu, Xiangbo and Yu, Fei and Chen, Guiming Hardy and Chen, Junying and Zhang, Hongbo and Li Jianquan and Wan Xiang and Wang, Benyou}, month = july, title = {{MultilingualSIFT: Multilingual Supervised Instruction Fine-tuning}}, url = {https://github.com/FreedomIntelligence/MultilingualSIFT.git}, version = {0.1}, year = {2023} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作