five

josancamon/finewiki

收藏
Hugging Face2025-11-24 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/josancamon/finewiki
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: url dtype: string - name: title dtype: string - name: text dtype: string - name: id dtype: string - name: language_code dtype: string - name: wikidata_id dtype: string - name: bytes_html dtype: int64 - name: wikitext dtype: string - name: version dtype: int64 - name: infoboxes dtype: string - name: has_math dtype: bool splits: - name: en num_bytes: 116882213276 num_examples: 6658869 download_size: 53339408896 dataset_size: 116882213276 configs: - config_name: default data_files: - split: en path: data/en-* ---

数据集信息: 特征: - 名称:网址 数据类型:字符串 - 名称:标题 数据类型:字符串 - 名称:文本 数据类型:字符串 - 名称:标识符 数据类型:字符串 - 名称:语言代码 数据类型:字符串 - 名称:维基数据标识符 数据类型:字符串 - 名称:HTML字节数 数据类型:int64 - 名称:维基文本 数据类型:字符串 - 名称:版本 数据类型:int64 - 名称:信息框 数据类型:字符串 - 名称:包含数学公式 数据类型:布尔值 拆分: - 名称:英文 字节数:116882213276 样本数:6658869 下载大小:53339408896 数据集大小:116882213276 配置: - 配置名称:默认 数据文件: - 拆分:英文 路径:data/en-*
提供机构:
josancamon
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作