Drug-trafficking lexicon
收藏github2024-11-25 更新2024-11-27 收录
下载链接:
https://github.com/areyesp-77/Drug-trafficking
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含关于毒品走私的西班牙语文本,用于训练词嵌入模型以识别与毒品相关的概念的创造性表达方式。数据集的构建目的是分析在非典型情境下(如毒品走私)中比喻语言的使用。
This dataset contains Spanish-language texts related to drug smuggling, and is utilized to train word embedding models to identify creative expressions of drug-related concepts. The dataset is constructed to analyze the use of figurative language in atypical contexts such as drug smuggling.
创建时间:
2024-11-25
原始信息汇总
数据集概述
数据集名称
Drug-trafficking lexicon
数据集描述
该数据集用于分析毒品交易领域中的比喻语言使用情况。通过构建一个关于西班牙语中毒品语言的语料库,训练了一个词嵌入模型,以识别命名毒品相关概念的创造性方式。研究结果表明,多种概念通常通过比喻、转喻或心理意象等比喻手段表达。
数据集用途
- 分析毒品交易领域中的比喻语言使用。
- 训练词嵌入模型以识别毒品相关概念的创造性命名方式。
引用信息
若使用该数据集,请引用以下文章:
Reyes, A., & Saldívar, R. (2022). Figurative Language in Atypical Contexts: Searching for Creativity in Narco Language. Applied Sciences, 12(3), 1642. https://doi.org/10.3390/app12031642
搜集汇总
数据集介绍

构建方式
在构建毒品走私词汇数据集时,研究者聚焦于分析非典型语境中的比喻语言,特别是毒品走私领域的语言。通过构建一个关于西班牙语中毒品语言的语料库,研究者训练了一个词嵌入模型,以识别命名毒品相关概念的创造性方式。该语料库的构建基于对毒品走私领域中比喻语言的深入分析,包括隐喻、转喻和心理意象等修辞手法的应用。
特点
该数据集的显著特点在于其专注于非典型语境中的比喻语言,特别是在毒品走私领域的应用。通过识别和分析这些比喻语言,数据集揭示了毒品走私活动中语言的隐晦性和创造性。此外,数据集还展示了如何通过自然语言处理技术来识别和理解这些复杂的语言现象。
使用方法
使用该数据集时,研究者可以通过分析其中的比喻语言来深入理解毒品走私领域的语言特征。此外,该数据集可用于训练和验证自然语言处理模型,以识别和分类毒品走私相关文本中的比喻语言。引用该数据集时,请参考Reyes和Saldívar(2022)的文章,以确保学术诚信和数据来源的可靠性。
背景与挑战
背景概述
在语言学研究中,隐喻和比喻语言的使用一直是重要的研究领域。近年来,研究人员开始关注在非典型语境中,如毒品交易领域,隐喻语言的应用。Reyes和Saldívar于2022年创建了'Drug-trafficking lexicon'数据集,旨在分析西班牙语中与毒品交易相关的隐喻语言。该数据集基于一个关于毒品语言的语料库,通过训练词嵌入模型,识别出多种隐喻表达方式,如隐喻、转喻和心理意象。这一研究不仅揭示了隐喻语言在日常交流中的普遍性,还展示了自然语言处理技术在识别这些创造性表达中的应用潜力。
当前挑战
构建'Drug-trafficking lexicon'数据集面临的主要挑战包括:首先,收集和整理与毒品交易相关的隐喻语言数据需要深入了解该领域的特殊术语和表达方式。其次,隐喻语言的多义性和复杂性使得数据标注和模型训练变得复杂。此外,由于毒品交易领域的敏感性,数据获取和处理的伦理问题也是一个重要挑战。最后,如何有效地将自然语言处理技术应用于识别和分类这些隐喻表达,仍需进一步研究和优化。
常用场景
经典使用场景
在毒品交易领域,该数据集被广泛用于分析和识别隐喻、转喻等修辞手法在毒品相关语言中的应用。通过训练词嵌入模型,研究者能够识别出毒品交易中常用的隐喻词汇,如'pozolero'(炖锅匠)在特定语境下指代杀手或毒贩。这种分析不仅揭示了毒品交易语言的隐秘性,还为理解犯罪网络中的沟通策略提供了新的视角。
实际应用
在实际应用中,该数据集为执法机构提供了识别和监控毒品交易网络的重要工具。通过分析隐喻语言,执法部门能够更准确地识别犯罪分子的身份和活动,从而提高打击毒品犯罪的效率。此外,该数据集还可用于培训自然语言处理模型,以辅助情报分析和犯罪预防工作。
衍生相关工作
基于该数据集,研究者们进一步开展了多项相关工作,包括开发更先进的词嵌入模型以提高隐喻识别的准确性,以及探索隐喻语言在其他犯罪领域中的应用。此外,该数据集还激发了对跨文化隐喻语言研究的兴趣,推动了语言学与犯罪学交叉领域的深入发展。
以上内容由遇见数据集搜集并总结生成



