Chinese Legal Documents|法律数据集|自然语言处理数据集
收藏
- 首次公开发布中国法律文献数据集,标志着中国法律信息系统化的开端。
- 中国法律文献数据集首次应用于司法实践中,提升了法律判决的效率和准确性。
- 数据集进行了重大更新,引入了更多详细的法律条文和案例分析,增强了数据集的实用性和深度。
- 中国法律文献数据集开始与国际法律数据库进行合作,促进了国际法律信息的交流与共享。
- 数据集进一步整合了人工智能技术,实现了法律文本的自动分类和智能检索,极大地提升了数据处理能力。
- 1Chinese Legal Documents: A Comprehensive Dataset for Legal Text AnalysisTsinghua University · 2021年
- 2Legal Judgment Prediction via Multi-Task Learning in Chinese Legal DocumentsPeking University · 2022年
- 3Exploring the Use of BERT for Legal Text Classification in Chinese Legal DocumentsShanghai Jiao Tong University · 2021年
- 4A Comparative Study of Text Embeddings for Legal Document Retrieval in Chinese Legal DocumentsZhejiang University · 2022年
- 5Legal Entity Recognition in Chinese Legal Documents using Deep Learning ApproachesFudan University · 2021年
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
中国知识产权局专利数据库
该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。
www.cnipa.gov.cn 收录