mziem/label_temperature_05
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mziem/label_temperature_05
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个字段,主要用于自然语言处理任务,特别是文本生成或文本预测。数据集包括原始评论、预测评论、BLEU评分、ROUGE评分(包括ROUGE-1、ROUGE-2、ROUGE-L)以及多个错误类型和备注字段,用于评估或注释模型预测的准确性或质量。数据集分为训练集,包含120个样本,总大小为1484652字节。
This dataset contains multiple fields primarily used for natural language processing tasks, especially text generation or text prediction. It includes original comments, predicted comments, BLEU scores, ROUGE scores (including ROUGE-1, ROUGE-2, ROUGE-L), and several error types and remark fields for evaluating or annotating the accuracy or quality of model predictions. The dataset is divided into a training set containing 120 samples, with a total size of 1484652 bytes.
提供机构:
mziem
原始信息汇总
数据集概述
数据集信息
特征
- file_id: 文件ID,数据类型为字符串。
- token_length: 标记长度,数据类型为64位整数。
- content: 内容,数据类型为字符串。
- masked_data: 掩码数据,数据类型为字符串。
- predict: 预测结果,数据类型为字符串。
- original_comment: 原始评论,数据类型为字符串。
- predicted_comment: 预测评论,数据类型为字符串。
- bleu_comment: BLEU评分,数据类型为64位浮点数。
- rouge_comment: ROUGE评分,包含以下子特征:
- rouge1: ROUGE-1评分,数据类型为64位浮点数。
- rouge2: ROUGE-2评分,数据类型为64位浮点数。
- rougeL: ROUGE-L评分,数据类型为64位浮点数。
- Error 1: 错误1,数据类型为字符串。
- Error 2: 错误2,数据类型为字符串。
- Error 3: 错误3,数据类型为字符串。
- Additional Errors: 附加错误,数据类型为字符串。
- Remarks: 备注,数据类型为字符串。
- Accuracy: 准确性,数据类型为字符串。
- Good: 良好,数据类型为字符串。
数据分割
- train: 训练集,包含120个样本,总字节数为1484652。
数据集大小
- 下载大小: 606268字节。
- 数据集大小: 1484652字节。
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



