RCODI/neural_dataset

Name: RCODI/neural_dataset
Creator: RCODI
Published: 2024-04-03 11:43:10
License: 暂无描述

Hugging Face2024-04-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/RCODI/neural_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

--- language: - en dataset_info: features: - name: Context dtype: string - name: Baseline Response dtype: string - name: bot dtype: string - name: response dtype: string - name: text similarity dtype: float64 - name: BLEU score dtype: float64 - name: ROUGE score dtype: float64 - name: LEVEN distance dtype: float64 - name: semantic similarity dtype: float64 - name: factual consistency dtype: int64 - name: LLM response length dtype: int64 - name: LLM sentiment dtype: float64 - name: LLM person form dtype: float64 - name: LLM pronoun dtype: float64 - name: LLM tense dtype: float64 - name: LLM exclamation dtype: float64 - name: LLM stimulating dialogue dtype: float64 - name: LLM acknowledging dtype: float64 - name: LLM collective reasoning dtype: float64 - name: LLM imperative statement dtype: float64 - name: LLM interim questions dtype: float64 - name: LLM caring statement dtype: float64 - name: baseline response length dtype: int64 - name: baseline sentiment dtype: float64 - name: baseline person form dtype: float64 - name: baseline pronoun dtype: float64 - name: baseline tense dtype: float64 - name: baseline exclamation dtype: float64 - name: baseline stimulating dialogue dtype: float64 - name: baseline acknowledging dtype: float64 - name: baseline collective reasoning dtype: float64 - name: baseline imperative statement dtype: float64 - name: baseline interim questions dtype: float64 - name: baseline caring statement dtype: float64 splits: - name: train num_bytes: 10702600 num_examples: 2688 download_size: 1714334 dataset_size: 10702600 configs: - config_name: default data_files: - split: train path: data/train-* ---

提供机构：

RCODI

原始信息汇总

数据集概述

特征信息

数据集包含以下特征：

Context: 类型为字符串。
Baseline Response: 类型为字符串。
bot: 类型为字符串。
response: 类型为字符串。
text similarity: 类型为浮点数。
BLEU score: 类型为浮点数。
ROUGE score: 类型为浮点数。
LEVEN distance: 类型为浮点数。
semantic similarity: 类型为浮点数。
factual consistency: 类型为整数。
LLM response length: 类型为整数。
LLM sentiment: 类型为浮点数。
LLM person form: 类型为浮点数。
LLM pronoun: 类型为浮点数。
LLM tense: 类型为浮点数。
LLM exclamation: 类型为浮点数。
LLM stimulating dialogue: 类型为浮点数。
LLM acknowledging: 类型为浮点数。
LLM collective reasoning: 类型为浮点数。
LLM imperative statement: 类型为浮点数。
LLM interim questions: 类型为浮点数。
LLM caring statement: 类型为浮点数。
baseline response length: 类型为整数。
baseline sentiment: 类型为浮点数。
baseline person form: 类型为浮点数。
baseline pronoun: 类型为浮点数。
baseline tense: 类型为浮点数。
baseline exclamation: 类型为浮点数。
baseline stimulating dialogue: 类型为浮点数。
baseline acknowledging: 类型为浮点数。
baseline collective reasoning: 类型为浮点数。
baseline imperative statement: 类型为浮点数。
baseline interim questions: 类型为浮点数。
baseline caring statement: 类型为浮点数。

数据分割

数据集包含以下分割：

train: 包含2688个样本，占用10702600字节。

数据集大小

下载大小: 1714334字节。
数据集大小: 10702600字节。

配置信息

config_name: default
data_files:
- split: train
- path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集