plaguss/argilla_sdk_docs_raw
收藏Hugging Face2024-06-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/plaguss/argilla_sdk_docs_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从`argilla-io/argilla-python`仓库文档中提取的文本块,这些文本块是通过运行`docs_dataset.py`脚本获取的。理想情况下,该数据集可用于从文档中启动知识库。需要注意的是,生成数据集的脚本仍处于实验阶段,存在重复块、排序不当和代码分区不明确等问题。
该数据集包含从`argilla-io/argilla-python`仓库文档中提取的文本块,这些文本块是通过运行`docs_dataset.py`脚本获取的。理想情况下,该数据集可用于从文档中启动知识库。需要注意的是,生成数据集的脚本仍处于实验阶段,存在重复块、排序不当和代码分区不明确等问题。
提供机构:
plaguss
原始信息汇总
数据集概述
数据集信息
-
特征(Features):
filename: 数据类型为字符串(string)。chunks: 数据类型为字符串(string)。
-
分割(Splits):
train:- 字节数(num_bytes): 139173
- 示例数(num_examples): 303
-
下载大小(download_size): 50618
-
数据集大小(dataset_size): 139173
配置(Configs)
- 配置名称(config_name): default
- 数据文件(data_files):
split: trainpath: data/train-*



