five

bvk/SMS-spam

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/bvk/SMS-spam
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含5,574条短信,其中747条被标记为垃圾短信。短信内容通常较短,有时较为隐晦和个人化。数据集来源于研究论文[Tiago],并由作者贡献到UCI的机器学习库中。数据集以CSV文件形式提供。

This dataset originates from the research paper [Tiago], contributed by the authors to the UCI Machine Learning repository. It contains 5,574 SMS messages, of which 747 are labeled as spam. The messages are typically short, and in some cases, quite cryptic and personal. The data is represented in a straightforward CSV file format.
提供机构:
bvk
原始信息汇总

数据集概述

基本信息

  • 名称: SMS-spam
  • 别名: bvk/SMS-spam
  • 创建者: bert van keulen
  • 链接: SMS-spam

描述

该数据集可在Kaggle、Huggingface等多个网站上找到,但其原始来源是[Tiago]的研究论文,该论文的作者将其贡献给了[UCI]的机器学习仓库。数据集包含5,574条短信,其中747条被标记为垃圾短信。短信通常简短,有时相当隐晦和个人化。CSV文件是数据的直接表示。

数据结构

  • 文件格式: Parquet
  • 子集: default
  • 字段:
    • default/label: 整数类型,表示标签。
    • default/data: 文本类型,表示短信内容。

关键词

  • 1K - 10K
  • csv
  • 文本
  • 数据集
  • pandas
  • Croissant
  • 🇺🇸 美国地区

参考

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作