coastalcph/fm-updates-llama-7b
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coastalcph/fm-updates-llama-7b
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
- split: validation
path: data/validation-*
dataset_info:
features:
- name: query
struct:
- name: label
dtype: string
- name: objects
list:
- name: aliases
sequence: string
- name: label
dtype: string
- name: qid
dtype: string
- name: qid
dtype: string
- name: rel_id
dtype: string
- name: relation
dtype: string
- name: prediction
struct:
- name: predictions
list:
- name: answer
dtype: string
- name: first_token_probability
dtype: float64
- name: per_token_probability
sequence: float64
- name: perplexity
dtype: float64
- name: query
dtype: string
- name: f1
dtype: float64
- name: relation
dtype: string
- name: type
dtype: string
- name: original_answer
dtype: string
- name: updates
sequence: string
splits:
- name: test
num_bytes: 440727.6757775683
num_examples: 480
- name: validation
num_bytes: 46827.315551366635
num_examples: 51
download_size: 380771
dataset_size: 487554.99132893496
---
# Dataset Card for "fm-updates-llama-7b"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 拆分集(split):test,路径:data/test-*
- 拆分集(split):validation,路径:data/validation-*
数据集信息(dataset_info):
特征:
- 特征名称:查询(query),结构体(struct):
- 子特征名称:标签(label),数据类型(dtype):字符串(string)
- 子特征名称:对象(objects),列表(list)类型,每个元素的结构体:
- 子子特征名称:别名(aliases),字符串序列(sequence: string)
- 子子特征名称:标签(label),数据类型:字符串
- 子子特征名称:实体ID(qid),数据类型:字符串
- 子特征名称:实体ID(qid),数据类型:字符串
- 子特征名称:关系ID(rel_id),数据类型:字符串
- 子特征名称:关系(relation),数据类型:字符串
- 特征名称:预测(prediction),结构体:
- 子特征名称:预测结果列表(predictions),列表类型,每个元素的结构体:
- 子子特征名称:答案(answer),数据类型:字符串
- 子子特征名称:首Token概率(first_token_probability),数据类型:64位浮点数(float64)
- 子子特征名称:逐Token概率(per_token_probability),浮点序列(sequence: float64)
- 子子特征名称:困惑度(perplexity),数据类型:64位浮点数
- 子特征名称:查询文本(query),数据类型:字符串
- 特征名称:F1值(f1),数据类型:64位浮点数
- 特征名称:关系(relation),数据类型:字符串
- 特征名称:类型(type),数据类型:字符串
- 特征名称:原始答案(original_answer),数据类型:字符串
- 特征名称:更新记录(updates),字符串序列(sequence: string)
拆分集(splits):
- 拆分集名称:test,字节数:440727.6757775683,样本数量:480
- 拆分集名称:validation,字节数:46827.315551366635,样本数量:51
下载大小:380771
数据集总大小:487554.99132893496
# 数据集卡片(Dataset Card):"fm-updates-llama-7b"
【需补充更多信息】,详见:https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards
提供机构:
coastalcph
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 数据文件:
- 测试集:
data/test-* - 验证集:
data/validation-*
- 测试集:
- 数据文件:
数据集信息
- 特征:
- 查询:
- 标签:字符串类型
- 对象:列表类型
- 别名:字符串序列
- 标签:字符串类型
- qid:字符串类型
- qid:字符串类型
- rel_id:字符串类型
- 关系:字符串类型
- 预测:
- 预测结果:列表类型
- 答案:字符串类型
- 第一个词的概率:浮点数类型
- 每个词的概率:浮点数序列
- 困惑度:浮点数类型
- 查询:字符串类型
- 预测结果:列表类型
- F1值:浮点数类型
- 关系:字符串类型
- 类型:字符串类型
- 原始答案:字符串类型
- 更新:字符串序列
- 查询:
数据集分割
- 测试集:
- 字节数:440727.6757775683
- 样本数:480
- 验证集:
- 字节数:46827.315551366635
- 样本数:51
数据集大小
- 下载大小:380771
- 数据集大小:487554.99132893496



