Format Detection 编程语言和文件格式检测
收藏Data Castle2022-04-08 更新2026-04-18 收录
下载链接:
https://www.datacastle.cn/dataset_description.html?type=dataset&id=1597
下载链接
链接失效反馈官方服务:
资源简介:
#### 背景描述
来自 GitHub 存储库的非二进制文件
#### 数据说明
数据集有 6 列,您可以使用 file_path 列读取文本文件
有 Assembly、Awk、Batchfile、C、C#、C++、CMake、CSS、CSV、Clojure、CoffeeScript、Common Lisp、D、Dart、Diff、Dockerfile、ERB、Elixir、Erlang、Fortran、GAS、GLSL、Go 的文件 , Gradle, Groovy, HTML, Haskell, Java, Javascript, Julia, Jupyter Notebook, Kotlin, LLVM, Less, Limbo, Lisp, Lua, Makefile, Markdown, PHP, Pascal, PowerShell, Prolog, Puppet, Python, Q#, Ruby 、Rust、SCSS、SQL、SVG、Scala、Scheme、Shell、Swift、TeX、Text、TypeScript、XML、YAML 等等。
我知道 HTML 不是一种编程语言。 没关系,因为它有 JSON 和 Text。
#### 数据来源
sources.json
#### 问题描述
NLP
提供机构:
托尔斯泰



