five

jelber2/RustBioGPT

收藏
Hugging Face2022-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jelber2/RustBioGPT
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit --- ```sh git clone https://github.com/natir/br.git git clone https://github.com/natir/pcon git clone https://github.com/natir/yacrd git clone https://github.com/natir/rasusa git clone https://github.com/natir/fpa git clone https://github.com/natir/kmrf rm -f RustBioGPT-train.csv && for i in `find . -name "*.rs"`;do paste -d "," <(echo $i|perl -pe "s/\.\/(\w+)\/.+/\"\1\"/g") <(echo $i|perl -pe "s/(.+)/\"\1\"/g") <(perl -pe "s/\n/\\\n/g" $i|perl -pe s"/\"/\'/g" |perl -pe "s/(.+)/\"\1\"/g") <(echo "mit"|perl -pe "s/(.+)/\"\1\"/g") >> RustBioGPT-train.csv; done sed -i '1i "repo_name","path","content","license"' RustBioGPT-train.csv ```
提供机构:
jelber2
原始信息汇总

数据集概述

数据集名称

  • RustBioGPT-train.csv

数据集内容

  • 包含多个文件的信息,每个文件记录包括:
    • repo_name:存储库名称
    • path:文件路径
    • content:文件内容
    • license:许可证类型(MIT)

数据集生成方法

  • 通过遍历指定目录下的所有.rs文件,使用paste命令将文件信息格式化为CSV格式,并存储在RustBioGPT-train.csv文件中。

许可证信息

  • MIT许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作