WendyHoang/news-ka-small-DISTILBERT
收藏Hugging Face2025-01-30 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/WendyHoang/news-ka-small-DISTILBERT
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含文本数据的数据集,其中包括文本内容(text)、对应的令牌化信息(tokens)、注意力掩码(attention_mask)、输入ID(input_ids)以及每个文本的令牌数量(token_count)。数据集被分为训练集和测试集,可用于自然语言处理任务,如文本分类、情感分析等。
This is a dataset containing text data, which includes the text content (text), corresponding tokenization information (tokens), attention masks (attention_mask), input IDs (input_ids), and the token count for each text. The dataset is split into training and test sets and can be used for natural language processing tasks such as text classification, sentiment analysis, etc.
提供机构:
WendyHoang



