Muennighoff/tasky-commits
收藏Hugging Face2023-03-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Muennighoff/tasky-commits
下载链接
链接失效反馈官方服务:
资源简介:
```python
import difflib
comms_neg = {'d6a51edc3e1cc7e7890b551c4f85d996e208153a', 'a5335eb51e6f26be07617599aa100fa18e5c3bb3', '7626b811492867af0eb76972135fd9e57f89badf', '4f38cab0095951af83ea628611c27363b3038c93', 'ac5035cb0c469261b27bbc1b290deb2d211bf0eb'}
neg = ds.filter(lambda x: x["commit"] in comms_neg)
diff = difflib.ndiff(neg[1]["old_contents"], neg[1]["new_contents"])
for i,s in enumerate(diff):
if s[0]==' ': continue
elif s[0]=='-':
print(u'Delete "{}" from position {}'.format(s[-1],i))
elif s[0]=='+':
print(u'Add "{}" to position {}'.format(s[-1],i))
```
提供机构:
Muennighoff
原始信息汇总
数据集概述
数据集内容
- 包含多个提交(commits)的标识符集合。
- 使用
difflib库进行内容差异比较。
数据集操作
- 筛选特定提交:通过检查提交标识符是否在预定义的负面提交集合中,筛选出特定提交。
- 差异分析:对筛选出的提交进行内容差异分析,具体操作包括:
- 比较旧内容与新内容。
- 识别并记录内容的删除和添加操作。
数据集用途
- 用于分析代码提交中的删除和添加操作,可能用于代码审查或版本控制分析。



