five

Coin-Meme

收藏
arXiv2024-12-06 更新2024-12-10 收录
下载链接:
https://github.com/hwlongCUHK/Coin-Meme.git
下载链接
链接失效反馈
官方服务:
资源简介:
Coin-Meme数据集是由香港中文大学创建的,旨在研究Web3生态系统中的Meme币。该数据集包含了3751个Meme币的视觉、文本、社区互动和财务数据,涵盖了2024年1月至11月期间在Solana区块链上创建的Meme币。数据集的创建过程包括从Dune.com提取元数据、使用Selenium和Pandas进行网页抓取以及数据清洗。Coin-Meme数据集的应用领域主要集中在文化与金融的交叉分析,旨在揭示Meme币在Web3生态中的文化叙事、社区互动和市场行为。

The Coin-Meme dataset was created by The Chinese University of Hong Kong, aiming to research meme coins within the Web3 ecosystem. It contains visual, textual, community interaction, and financial data of 3,751 meme coins, covering all meme coins created on the Solana blockchain between January and November 2024. The development of this dataset involved extracting metadata from Dune.com, conducting web scraping with Selenium and Pandas, and performing data cleaning. The primary application domains of the Coin-Meme dataset center on the cross-analysis of culture and finance, with the goal of revealing the cultural narratives, community interactions, and market behaviors of meme coins in the Web3 ecosystem.
提供机构:
香港中文大学
创建时间:
2024-12-06
搜集汇总
数据集介绍
main_image_url
构建方式
Coin-Meme数据集的构建始于从Pump.fun平台提取的元数据,包括代币地址、创建时间、名称和创建者。通过Selenium和Pandas构建的网络爬虫管道,自动提取了文本描述、代币图像、用户评论和财务数据。数据清洗阶段包括文本数据的预处理,如转换为小写、去除非字母字符、停用词移除、分词和词形还原,以及图像数据的调整和缺失值处理。最终,数据集包含了2024年1月至11月期间创建的3,751个代币,涵盖了文本、视觉、社区互动和财务数据四个维度。
特点
Coin-Meme数据集的独特之处在于其多模态特性,整合了文本描述、视觉内容、社区互动和财务数据。这种多模态设计使得研究者能够全面分析代币的文化、社区和金融动态。此外,数据集的时间跨度和代币数量提供了对代币生态系统的全面概览,有助于揭示文化主题、社区互动和金融行为之间的复杂关系。
使用方法
研究者可以通过Coin-Meme数据集进行多模态分析,利用文本、视觉、社区和财务数据的整合来探索代币的文化和金融动态。例如,可以应用K-Means聚类分析不同代币的主题和情感,使用词云分析揭示主要的文化主题,或通过情感分析了解社区互动的情感倾向。此外,财务数据的分析可以提供关于市场进入时间和市场资本化的深入见解,帮助理解代币的市场行为和潜在价值。
背景与挑战
背景概述
在Web3生态系统中,Memecoin现象迅速崛起,成为互联网文化和去中心化金融交汇的独特产物。不同于比特币等传统加密货币,Memecoin的兴起主要依赖于社交媒体的参与、幽默元素和文化叙事,而非内在的实用价值。Coin-Meme数据集由香港中文大学的Hou-Wan Long、香港教育大学的Nga-Man Wong和华盛顿大学的Wei Cai共同创建,旨在通过多模态分析方法,深入研究Memecoin在Web3生态中的文化与金融双重维度。该数据集整合了视觉、文本、社区互动和金融数据,为研究者提供了一个全面了解Memecoin如何通过文化叙事、社区参与和Web3技术影响市场行为的平台。
当前挑战
Coin-Meme数据集面临的挑战主要集中在两个方面。首先,Memecoin的研究领域相对较新,现有的研究多聚焦于其金融层面的市场动态和价格波动,而忽视了文化和社会驱动力对其创建和发展的影响。其次,数据集的构建过程中,如何从Pump.fun平台高效且准确地提取和清洗多模态数据,确保数据的完整性和一致性,是一个技术上的挑战。此外,如何通过多模态分析框架,有效整合和解读视觉、文本、社区和金融数据,揭示Memecoin在Web3生态中的复杂动态,也是研究中的一个重要难题。
常用场景
经典使用场景
Coin-Meme数据集的经典使用场景在于其多模态分析框架,该框架整合了视觉、文本、社区互动和金融数据,以全面解析memecoin在Web3生态系统中的文化与金融动态。通过聚类分析、情感分析和词云可视化,研究者能够识别出以幽默、动物和政治讽刺为中心的主题群组,从而深入理解memecoin的文化叙事和社区情感。
解决学术问题
Coin-Meme数据集解决了memecoin研究中长期存在的文化与金融维度分离的问题。传统研究多聚焦于memecoin的金融特性,而忽视了其背后的文化和社会驱动因素。该数据集通过多模态分析,揭示了文化叙事、社区互动与Web3技术如何共同影响memecoin的采用和市场行为,为学术界提供了全面的研究视角。
衍生相关工作
Coin-Meme数据集的发布激发了一系列相关研究工作,包括对memecoin市场情感操纵的深入研究、社交媒体平台对memecoin价格影响的分析,以及Web3治理机制中memecoin角色的探讨。这些研究不仅扩展了memecoin的理论框架,还为实际应用提供了新的工具和方法,推动了Web3生态系统的进一步发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作