africa-child-online-safety
收藏数据集概述:Child Online Safety & Exploitation Intelligence (Africa)
基本信息
- 数据集名称: Child Online Safety & Exploitation Intelligence (Africa)
- 所属集合: Africa Cyber Threat Intelligence
- 创建者: electricsheepafrica
- 语言: 英语
- 许可证: MIT
- 任务类别: 表格分类(tabular-classification)
- 标签: 网络安全、非洲、儿童在线安全、在线剥削、诱骗检测、性勒索、威胁情报
数据集规模与构成
- 行数: 10,000 条记录(正负样本各 5,000,平衡 50/50)
- 数据性质: 全部为合成数据(is_synthetic=1),基于真实世界研究数据生成
核心研究领域
该数据集模拟非洲地区儿童在线安全威胁与剥削模式,用于检测与预防研究。非洲拥有全球最年轻的人口(60% 在 25 岁以下),移动互联网普及迅速,但数字素养、家长监管和平台内容审核严重不足,导致儿童易成为在线诱骗、性勒索、儿童性剥削材料(CSE)传播、直播虐待和贩运等犯罪的目标。
非洲特有模式亮点
- 青年移动端优先访问: 儿童使用父母手机、共享家庭设备和网吧,监管薄弱
- 主要平台: WhatsApp、TikTok、Instagram、Facebook、PUBG Mobile、Free Fire、Bigo Live、Tango 等
- 移动货币剥削: 通过 M-Pesa、OPay 等支付性勒索费用;话费充值作为小额支付
- 诱骗手段: 虚假奖学金、虚假收养、成名/职业承诺、游戏社区渗透、宗教领袖冒充
- 弱势群体: 孤儿、难民、流浪儿童、寄宿学校学生、贫困儿童、残障儿童
- 施害者类型: 教师、宗教领袖、家庭朋友、雇主(不仅限于陌生人)
- 直播应用: Bigo Live、Tango、Likee、Vskit(年龄验证薄弱,有点赞打赏机制)
- 跨境要素: 外国人诱骗非洲儿童;社交媒体助长跨境贩运
- 执法不足: 许多非洲国家缺乏专门的儿童在线保护热线和网络犯罪调查部门
- 文化因素: 羞耻感和沉默文化阻止报告;社区社交网络放大联系人列表威胁
- 同伴虐待: 同伴间性勒索、通过学校 WhatsApp 群进行的同伴间虐待
剥削类型(共 20 类)
| 类型 | 描述 |
|---|---|
online_grooming |
系统性在线诱骗 |
sextortion |
性勒索 |
cse_material_distribution |
儿童性剥削材料分享 |
live_streaming_abuse |
直播虐待 |
child_trafficking_facilitation |
数字化儿童贩运协助 |
fake_scholarship_scam |
虚假奖学金诱骗 |
fake_adoption_scam |
虚假收养诱骗 |
gaming_platform_grooming |
游戏社区诱骗 |
social_media_exploitation |
社交媒体虐待 |
messaging_app_grooming |
通讯应用诱骗 |
cryptocurrency_payment_abuse |
加密货币支付虐待 |
deepfake_child_exploitation |
AI 生成的合成虐待 |
peer_to_peer_abuse |
同伴间受害 |
radicalization_exploitation |
通过诱骗进行极端化 |
forced_labor_recruitment |
强迫劳动招募 |
sexual_extortion_by_peer |
同伴性勒索 |
blackmail_with_real_images |
真实图像勒索 |
online_dating_app_exploitation |
约会应用诱骗 |
live_streaming_platform_abuse |
直播平台虐待 |
encrypted_platform_abuse |
加密平台虐待 |
建模平台
WhatsApp · Facebook · Instagram · TikTok · Telegram · Snapchat · YouTube · Twitter/X · PUBG Mobile · Free Fire · Discord · Bigo Live · Tango · Yubo · Likee · Vskit · IMO · Messenger Kids · 约会应用 · 在线游戏 · SMS/USSD · 网吧 · 加密聊天
数据特征(共 70+ 列)
基础特征
| 列名 | 类型 | 描述 |
|---|---|---|
record_id |
str | 唯一标识符 |
country |
str | 非洲国家(20个国家) |
exploitation_type |
str | 威胁类型 |
platform |
str | 使用的平台 |
victim_age_group |
str | 受害者年龄分组 |
victim_gender |
str | 受害者性别 |
vulnerability_factor |
str | 脆弱因素 |
perpetrator_type |
str | 施害者类型 |
monetization_method |
str | 财务方式 |
content_type |
str | 涉及的内容类型 |
受害者影响特征
victim_count,reports_received,known_victim,victim_reportedparent_aware,school_aware,victim_shamed_silencedvictim_self_harm_thoughts,victim_attempted_suicide,victim_dropped_out_school,victim_ran_away,victim_traffickedmultiple_victims_same_perpetrator,cross_border_victims
技术操作特征
age_verification_bypassed,fake_profile_used,cloned_profileprofile_posed_as_minor,profile_posed_as_peer,profile_posed_as_celebrity,profile_posed_as_charity_workergroup_chat_used,disappearing_messages,encrypted_chat_usedlive_streaming_feature_used,location_sharing_enabled,video_call_used,voice_call_used
行为与周期特征
initial_contact_days,trust_building_duration_dayssexual_content_introduced,personal_information_extracted,family_information_extracted,school_information_extractedphotos_requested,videos_requested,live_stream_requested,in_person_meeting_requested
威胁与承诺特征
threat_of_violence_made,threat_of_shaming_made,threat_to_family_madepromises_of_money_gifts,promises_of_scholarship,promises_of_fame_career,promises_of_relationship
经济与检测特征
financial_loss_to_victim_usd,perpetrator_revenue_usddetected,time_to_detect_days,detected_byplatform_reported,account_suspended,law_enforcement_notifiedperpetrator_identified,perpetrator_arrestedvictim_referred_services,counseling_provided,digital_forensics_conducted,public_awareness_campaign_triggered
标记特征
label: 1 = 剥削事件,0 = 正常is_synthetic: 1 = 合成数据
提取特征
- 诱骗深度:
grooming_progression_score,advanced_grooming,escalation_pattern - 胁迫程度:
coercion_score,coercive_grooming,violence_threat - 欺骗与规避:
deception_score,evasion_score,platform_abuse_score - 受害者风险:
victim_vulnerability_score,high_vulnerability,very_young - 受害者影响:
severe_victim_impact,trafficking_indicator,victim_silenced - 响应质量:
response_effectiveness_score,impunity,victim_support - 独热编码: 20种剥削类型、14种平台、年龄分组、脆弱因素、施害者类型、区域标志
- 综合评分:
exploitation_threat_score,victim_vulnerability_score,response_effectiveness_score
情报来源
该数据集基于以下真实世界研究数据合成生成:
- UNICEF 儿童在线安全报告 — https://www.unicef.org/media
- WeProtect 全球联盟威胁评估 2024 — https://www.weprotect.org/global-threat-assessment-2024/
- INTERPOL 非洲儿童性剥削行动 — https://www.interpol.int/en/Crimes/Crimes-against-children/Online-child-sexual-exploitation-and-abuse
- IWF 年度报告 2024 — https://www.iwf.org.uk/annual-report-2024/
- ECOWAS 儿童保护策略 — https://ecowas.int/ecowas-child-policy/
使用方式
python from datasets import load_dataset dataset = load_dataset("electricsheepafrica/africa-child-online-safety")
引用
bibtex @misc{electricsheepafrica2026childsafety, title = {Child Online Safety & Exploitation Intelligence (Africa)}, author = {Electric Sheep Africa}, year = {2026}, howpublished = {url{https://huggingface.co/datasets/electricsheepafrica/africa-child-online-safety}} }




