yalhessi/lemexp
收藏Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/yalhessi/lemexp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:default和hol。每个配置都包含三个主要特征:defs(定义)、symbols(符号)和lemma(词元)。数据集主要用于训练,包含32920个示例。default配置的总数据大小为75847048字节,而hol配置的总数据大小为73239698字节。这些特征表明数据集可能用于自然语言处理任务,如词义消歧或语义分析。
The dataset includes two configurations: default and hol. Each configuration contains three main features: defs (definitions), symbols (symbols), and lemma (lemmas). The dataset is primarily used for training and contains 32,920 examples. The total data size for the default configuration is 75,847,048 bytes, while for the hol configuration, it is 73,239,698 bytes. These features suggest that the dataset may be used for natural language processing tasks such as word sense disambiguation or semantic analysis.
提供机构:
yalhessi
原始信息汇总
数据集概述
配置信息
默认配置 (default)
- 特征:
defs: 字符串类型symbols: 字符串类型lemma: 字符串类型
- 分割:
train:- 字节数: 75847048
- 样本数: 32920
- 下载大小: 2717693 字节
- 数据集大小: 75847048 字节
- 数据文件:
train:data/train-*
HOL 配置 (hol)
- 特征:
defs: 字符串列表symbols: 字符串列表lemma: 字符串类型
- 分割:
train:- 字节数: 73239698
- 样本数: 32920
- 下载大小: 2338415 字节
- 数据集大小: 73239698 字节
- 数据文件:
train:hol/train-*



