BigAction/the-meta-wave-retrieved
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/BigAction/the-meta-wave-retrieved
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如查询(query)、HTML内容(html)、XPath(xpath)、外部HTML(outer_html)、检索查询(retriever_query)、LLM查询(llm_query)、HTML ID(html_id)、检索召回率(recall_retriever)、检索精度(precision_retriever)、源节点(source_nodes)和结果字典(results_dict)。数据集包含一个训练集,共有250个示例,总大小为404,751,310字节。下载大小为131,077,835字节。
The dataset contains multiple feature fields such as query, HTML content, XPath, outer HTML, retriever query, LLM query, HTML ID, recall retriever, precision retriever, source nodes, and results dictionary. The dataset includes a training split with 250 examples, totaling 404,751,310 bytes. The download size is 131,077,835 bytes.
提供机构:
BigAction
原始信息汇总
数据集概述
数据集信息
特征
- query: 数据类型为字符串。
- html: 数据类型为字符串。
- xpath: 数据类型为字符串。
- outer_html: 数据类型为字符串。
- retriever_query: 数据类型为字符串。
- llm_query: 数据类型为字符串。
- html_id: 数据类型为字符串。
- recall_retriever: 数据类型为浮点数(float64)。
- precision_retriever: 数据类型为浮点数(float64)。
- source_nodes: 数据类型为字符串。
- results_dict: 数据类型为字符串。
数据分割
- train: 包含250个样本,总大小为404751310字节。
数据集大小
- 下载大小: 131077835字节。
- 数据集总大小: 404751310字节。
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



