five

coastalcph/fm-updates-llama-7b

收藏
Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coastalcph/fm-updates-llama-7b
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: test path: data/test-* - split: validation path: data/validation-* dataset_info: features: - name: query struct: - name: label dtype: string - name: objects list: - name: aliases sequence: string - name: label dtype: string - name: qid dtype: string - name: qid dtype: string - name: rel_id dtype: string - name: relation dtype: string - name: prediction struct: - name: predictions list: - name: answer dtype: string - name: first_token_probability dtype: float64 - name: per_token_probability sequence: float64 - name: perplexity dtype: float64 - name: query dtype: string - name: f1 dtype: float64 - name: relation dtype: string - name: type dtype: string - name: original_answer dtype: string - name: updates sequence: string splits: - name: test num_bytes: 440727.6757775683 num_examples: 480 - name: validation num_bytes: 46827.315551366635 num_examples: 51 download_size: 380771 dataset_size: 487554.99132893496 --- # Dataset Card for "fm-updates-llama-7b" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置项: - 配置名称:default 数据文件: - 拆分集(split):test,路径:data/test-* - 拆分集(split):validation,路径:data/validation-* 数据集信息(dataset_info): 特征: - 特征名称:查询(query),结构体(struct): - 子特征名称:标签(label),数据类型(dtype):字符串(string) - 子特征名称:对象(objects),列表(list)类型,每个元素的结构体: - 子子特征名称:别名(aliases),字符串序列(sequence: string) - 子子特征名称:标签(label),数据类型:字符串 - 子子特征名称:实体ID(qid),数据类型:字符串 - 子特征名称:实体ID(qid),数据类型:字符串 - 子特征名称:关系ID(rel_id),数据类型:字符串 - 子特征名称:关系(relation),数据类型:字符串 - 特征名称:预测(prediction),结构体: - 子特征名称:预测结果列表(predictions),列表类型,每个元素的结构体: - 子子特征名称:答案(answer),数据类型:字符串 - 子子特征名称:首Token概率(first_token_probability),数据类型:64位浮点数(float64) - 子子特征名称:逐Token概率(per_token_probability),浮点序列(sequence: float64) - 子子特征名称:困惑度(perplexity),数据类型:64位浮点数 - 子特征名称:查询文本(query),数据类型:字符串 - 特征名称:F1值(f1),数据类型:64位浮点数 - 特征名称:关系(relation),数据类型:字符串 - 特征名称:类型(type),数据类型:字符串 - 特征名称:原始答案(original_answer),数据类型:字符串 - 特征名称:更新记录(updates),字符串序列(sequence: string) 拆分集(splits): - 拆分集名称:test,字节数:440727.6757775683,样本数量:480 - 拆分集名称:validation,字节数:46827.315551366635,样本数量:51 下载大小:380771 数据集总大小:487554.99132893496 # 数据集卡片(Dataset Card):"fm-updates-llama-7b" 【需补充更多信息】,详见:https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards
提供机构:
coastalcph
原始信息汇总

数据集概述

数据集配置

  • 默认配置
    • 数据文件
      • 测试集data/test-*
      • 验证集data/validation-*

数据集信息

  • 特征
    • 查询
      • 标签:字符串类型
      • 对象:列表类型
        • 别名:字符串序列
        • 标签:字符串类型
        • qid:字符串类型
      • qid:字符串类型
      • rel_id:字符串类型
      • 关系:字符串类型
    • 预测
      • 预测结果:列表类型
        • 答案:字符串类型
        • 第一个词的概率:浮点数类型
        • 每个词的概率:浮点数序列
        • 困惑度:浮点数类型
      • 查询:字符串类型
    • F1值:浮点数类型
    • 关系:字符串类型
    • 类型:字符串类型
    • 原始答案:字符串类型
    • 更新:字符串序列

数据集分割

  • 测试集
    • 字节数:440727.6757775683
    • 样本数:480
  • 验证集
    • 字节数:46827.315551366635
    • 样本数:51

数据集大小

  • 下载大小:380771
  • 数据集大小:487554.99132893496
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作