five

Wisesight 情感语料库数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-26473.html
下载链接
链接失效反馈
官方服务:
资源简介:
对于 wisesight-160 和 wisesight-1000,它们是从这个语料库中以标记化形式的样本, 有关数据探索和分类示例,请参阅泰语文本分类基准。 个人资料 - 我们试图从该数据集中排除任何已知的个人身份信息。 - 删除用户名和非公众人物名称- 电话号码被屏蔽(例如 088-888-8888、09-9999-9999、0-2222-2222) - 如果您看到任何个人数据仍然保留在集合中,请告诉我们 - 我们可以删除它们。 情感值注释方法 - 情感值是由人类注释者分配的。 - 人类注释者尽最大努力为一条信息分配三个标签中的一个。 - 一条信息可能是含糊不清的。在可能的情况下,判断将完全基于文本本身。 - 在某些情况下,比如上下文缺失时,注释者可能不得不依靠他/她自己的世界知识,只是猜测。 - 在某些情况下,人类注释者可能有机会接触到信息的上下文,比如一张图片。这些额外的信息并不包括在这个语料库中。 - 同意、享受和满意是积极的。不同意、悲伤和失望是负面的。 - 对某一主题或某一产品表现出的兴趣被算作是积极的。 - 在这个意义上,如果一个关于特定产品的问题显示了对该产品的兴趣,那么它就会有一个积极的情感值。- 说其他产品或服务更好则被认为是负面的。 - 一般的信息或新闻标题往往被算作是中性的。 属性信息。 一条信息只能有一个标签。问题、消极、中立、积极所有信息都保存在明文文件中。 所有文件都是UTF-8编码的。 每行有一条信息。原始信息中的换行符将被替换成空格。 每个文件有一个标签。 q.txt 问题 (575条信息) neg.txt 负面情绪的信息(6,823条) neu.txt 带有中性情绪的信息(14,561) pos.txt 有正面情绪的信息(4,778) Citation Request: Arthit Suriyawongkul, Ekapol Chuangsuwanich, Pattarawat Chormai, and Charin Polpanumas. 2019. PyThaiNLP/wisesight-sentiment: First release. September. BibTeX: @software{bact_2019_3457447, author = {Suriyawongkul, Arthit and Chuangsuwanich, Ekapol and Chormai, Pattarawat and Polpanumas, Charin}, title = {PyThaiNLP/wisesight-sentiment: First release}, month = sep, year = 2019, publisher = {Zenodo}, version = {v1.0}, doi = {10.5281/zenodo.3457447}, url = {[Web link]} }
提供机构:
帕依提提
二维码
社区交流群
二维码
科研交流群
商业服务