five

Muennighoff/tasky-commits

收藏
Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Muennighoff/tasky-commits
下载链接
链接失效反馈
官方服务:
资源简介:
```python import difflib comms_neg = {'d6a51edc3e1cc7e7890b551c4f85d996e208153a', 'a5335eb51e6f26be07617599aa100fa18e5c3bb3', '7626b811492867af0eb76972135fd9e57f89badf', '4f38cab0095951af83ea628611c27363b3038c93', 'ac5035cb0c469261b27bbc1b290deb2d211bf0eb'} neg = ds.filter(lambda x: x["commit"] in comms_neg) diff = difflib.ndiff(neg[1]["old_contents"], neg[1]["new_contents"]) for i,s in enumerate(diff): if s[0]==' ': continue elif s[0]=='-': print(u'Delete "{}" from position {}'.format(s[-1],i)) elif s[0]=='+': print(u'Add "{}" to position {}'.format(s[-1],i)) ```
提供机构:
Muennighoff
原始信息汇总

数据集概述

数据集内容

  • 包含多个提交(commits)的标识符集合。
  • 使用difflib库进行内容差异比较。

数据集操作

  1. 筛选特定提交:通过检查提交标识符是否在预定义的负面提交集合中,筛选出特定提交。
  2. 差异分析:对筛选出的提交进行内容差异分析,具体操作包括:
    • 比较旧内容与新内容。
    • 识别并记录内容的删除和添加操作。

数据集用途

  • 用于分析代码提交中的删除和添加操作,可能用于代码审查或版本控制分析。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作