arbml/TUNIZI
收藏Hugging Face2024-03-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arbml/TUNIZI
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Card for TUNIZI
## Table of Contents
- [Table of Contents](#table-of-contents)
- [Dataset Description](#dataset-description)
- [Dataset Summary](#dataset-summary)
- [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards)
- [Languages](#languages)
- [Dataset Structure](#dataset-structure)
- [Data Instances](#data-instances)
- [Data Fields](#data-fields)
- [Data Splits](#data-splits)
- [Dataset Creation](#dataset-creation)
- [Curation Rationale](#curation-rationale)
- [Source Data](#source-data)
- [Annotations](#annotations)
- [Personal and Sensitive Information](#personal-and-sensitive-information)
- [Considerations for Using the Data](#considerations-for-using-the-data)
- [Social Impact of Dataset](#social-impact-of-dataset)
- [Discussion of Biases](#discussion-of-biases)
- [Other Known Limitations](#other-known-limitations)
- [Additional Information](#additional-information)
- [Dataset Curators](#dataset-curators)
- [Licensing Information](#licensing-information)
- [Citation Information](#citation-information)
- [Contributions](#contributions)
## Dataset Description
- **Homepage: [info]**
- **Repository: [info]**
- **Paper: [info]**
- **Leaderboard: [info]**
- **Point of Contact: [info]**
### Dataset Summary
[More Information Needed]
### Supported Tasks and Leaderboards
[More Information Needed]
### Languages
[More Information Needed]
## Dataset Structure
### Data Instances
[More Information Needed]
### Data Fields
[More Information Needed]
### Data Splits
[More Information Needed]
## Dataset Creation
### Curation Rationale
[More Information Needed]
### Source Data
#### Initial Data Collection and Normalization
[More Information Needed]
#### Who are the source language producers?
[More Information Needed]
### Annotations
#### Annotation process
[More Information Needed]
#### Who are the annotators?
[More Information Needed]
### Personal and Sensitive Information
[More Information Needed]
## Considerations for Using the Data
### Social Impact of Dataset
[More Information Needed]
### Discussion of Biases
[More Information Needed]
### Other Known Limitations
[More Information Needed]
## Additional Information
### Dataset Curators
[More Information Needed]
### Licensing Information
[More Information Needed]
### Citation Information
```
@inproceedings{Chayma2020,
title={TUNIZI: a Tunisian Arabizi sentiment analysis Dataset},
author={Fourati, Chayma and Messaoudi, Abir and Haddad, Hatem},
booktitle={AfricaNLP Workshop, Putting Africa on the NLP Map. ICLR 2020, Virtual Event},
volume = {arXiv:3091079},
year = {2020},
url = {https://arxiv.org/submit/3091079},
}
```
### Contributions
Thanks to [@github-username](https://github.com/<github-username>) for adding this dataset.
# TUNIZI 数据集卡片
## 目录
- [目录](#目录)
- [数据集描述](#数据集描述)
- [数据集概述](#数据集概述)
- [支持任务与排行榜](#支持任务与排行榜)
- [语言](#语言)
- [数据集结构](#数据集结构)
- [数据实例](#数据实例)
- [数据字段](#数据字段)
- [数据划分](#数据划分)
- [数据集构建](#数据集构建)
- [构建初衷](#构建初衷)
- [源数据](#源数据)
- [标注信息](#标注信息)
- [个人与敏感信息](#个人与敏感信息)
- [数据使用注意事项](#数据使用注意事项)
- [数据集的社会影响](#数据集的社会影响)
- [偏见讨论](#偏见讨论)
- [其他已知局限性](#其他已知局限性)
- [附加信息](#附加信息)
- [数据集维护者](#数据集维护者)
- [许可信息](#许可信息)
- [引用信息](#引用信息)
- [贡献致谢](#贡献致谢)
## 数据集描述
- **主页:[info]**
- **代码仓库:[info]**
- **相关论文:[info]**
- **排行榜:[info]**
- **联系方式:[info]**
### 数据集概述
[需补充更多信息]
### 支持任务与排行榜
[需补充更多信息]
### 语言
[需补充更多信息]
## 数据集结构
### 数据实例
[需补充更多信息]
### 数据字段
[需补充更多信息]
### 数据划分
[需补充更多信息]
## 数据集构建
### 构建初衷
[需补充更多信息]
### 源数据
#### 初始数据收集与标准化处理
[需补充更多信息]
#### 源数据的语言产出主体
[需补充更多信息]
### 标注信息
#### 标注流程
[需补充更多信息]
#### 标注人员信息
[需补充更多信息]
### 个人与敏感信息
[需补充更多信息]
## 数据使用注意事项
### 数据集的社会影响
[需补充更多信息]
### 偏见讨论
[需补充更多信息]
### 其他已知局限性
[需补充更多信息]
## 附加信息
### 数据集维护者
[需补充更多信息]
### 许可信息
[需补充更多信息]
### 引用信息
@inproceedings{Chayma2020,
title={TUNIZI: 突尼斯阿拉伯拉丁化(Arabizi)情感分析数据集},
author={Fourati, Chayma and Messaoudi, Abir and Haddad, Hatem},
booktitle={非洲自然语言处理研讨会:将非洲纳入自然语言处理版图,ICLR 2020 虚拟会议},
volume = {arXiv:3091079},
year = {2020},
url = {https://arxiv.org/submit/3091079},
}
### 贡献致谢
感谢 [@github-用户名](https://github.com/<github-username>) 提交此数据集。
提供机构:
arbml
原始信息汇总
数据集概述
数据集名称
- 名称: TUNIZI
数据集描述
- 摘要: [更多信息待补充]
- 支持的任务和排行榜: [更多信息待补充]
- 语言: [更多信息待补充]
数据集结构
- 数据实例: [更多信息待补充]
- 数据字段: [更多信息待补充]
- 数据分割: [更多信息待补充]
数据集创建
- 数据收集和规范化: [更多信息待补充]
- 源语言生产者: [更多信息待补充]
- 标注过程: [更多信息待补充]
- 标注者: [更多信息待补充]
- 个人和敏感信息: [更多信息待补充]
使用数据的考虑
- 数据集的社会影响: [更多信息待补充]
- 偏见讨论: [更多信息待补充]
- 其他已知限制: [更多信息待补充]
附加信息
-
数据集策展人: [更多信息待补充]
-
许可信息: [更多信息待补充]
-
引用信息:
@inproceedings{Chayma2020, title={TUNIZI: a Tunisian Arabizi sentiment analysis Dataset}, author={Fourati, Chayma and Messaoudi, Abir and Haddad, Hatem}, booktitle={AfricaNLP Workshop, Putting Africa on the NLP Map. ICLR 2020, Virtual Event}, volume = {arXiv:3091079}, year = {2020}, url = {https://arxiv.org/submit/3091079}, }
-
贡献者: 感谢 @github-username 添加此数据集。



