thearod5/cm1
收藏Hugging Face2024-06-15 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/thearod5/cm1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由NASA的Jane Huffman Hayes整理提供,主要用于软件可追溯性研究,涉及文本分类和句子相似性任务。数据集包含多个配置文件,如artifacts、traces、matrices和train,每个配置文件对应一个CSV文件。数据集的语言为英语,大小在1K到10K之间。引用文献为Jane Huffman Hayes等人于2006年发表的关于需求追踪方法研究的论文。
The dataset is provided courtesy of NASA, collated by Jane Huffman Hayes, and is primarily used for software traceability research, involving text classification and sentence similarity tasks. The dataset includes multiple configuration files such as artifacts, traces, matrices, and train, each corresponding to a CSV file. The language of the dataset is English, and its size ranges between 1K and 10K. The reference literature is a paper published by Jane Huffman Hayes et al. in 2006 on the study of methods for requirements tracing.
提供机构:
thearod5
原始信息汇总
数据集概述
数据来源
- 数据由NASA整理,Jane Huffman Hayes提供。
数据文件
- artifacts:
artifacts.csv - traces:
traces.csv - matrices:
matrices.csv - train:
train.csv
许可
- MIT许可证
任务类别
- 文本分类
- 句子相似度
语言
- 英语
标签
- 软件可追溯性
数据规模
- 1K<n<10K
引用信息
- 作者: Jane Huffman Hayes, Alex Dekhtyar, Senthil Karthikeyan Sundaram
- 标题: Advancing Candidate Link Generation for Requirements Tracing: The Study of Methods
- 期刊: IEEE Trans. Software Eng.
- 卷: 32
- 期: 1
- 页码: 4-19
- 年份: 2006
搜集汇总
数据集介绍

背景与挑战
背景概述
CM1数据集是一个用于文本分类和句子相似性任务的英语数据集,包含1,287行数据,涉及软件需求跟踪领域。数据集由NASA提供,格式为CSV,适用于研究软件跟踪性相关的问题。
以上内容由遇见数据集搜集并总结生成



