five

ce-lery/mistral-3b-dataset

收藏
Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ce-lery/mistral-3b-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
# mistral-3b-dataset Please run this command. ```bash mkdir -p pretrain/input/ cd pretrain/input/ GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/datasets/ce-lery/mistral-3b-dataset.git cd mistral-3b-dataset git lfs pull bash train_merge.sh mv ./train.jsonl ../ mv ./test.jsonl ../ cd ../../../ ```
提供机构:
ce-lery
原始信息汇总

mistral-3b-dataset

数据集结构

  • 数据集包含以下文件:
    • train.jsonl
    • test.jsonl

数据集获取方式

  • 通过Git LFS从以下链接克隆获取:
    • https://huggingface.co/datasets/ce-lery/mistral-3b-dataset.git

数据集使用步骤

  1. 创建目录:pretrain/input/
  2. 进入目录:cd pretrain/input/
  3. 克隆数据集:
    • 设置环境变量:GIT_LFS_SKIP_SMUDGE=1
    • 执行克隆命令:git clone https://huggingface.co/datasets/ce-lery/mistral-3b-dataset.git
  4. 进入数据集目录:cd mistral-3b-dataset
  5. 拉取数据:git lfs pull
  6. 执行数据处理脚本:bash train_merge.sh
  7. 移动数据文件至上级目录:
    • mv ./train.jsonl ../
    • mv ./test.jsonl ../
  8. 返回上级目录:cd ../../../
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作