Skip to content

Latest commit

 

History

History
54 lines (18 loc) · 1.39 KB

File metadata and controls

54 lines (18 loc) · 1.39 KB

Task1 数据集探索 (2 days)

  1. 数据集

数据集:中、英文数据集各一份

中文数据集:THUCNews

THUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud

英文数据集:IMDB数据集 Sentiment Analysis

  1. IMDB数据集下载和探索

参考TensorFlow官方教程:影评文本分类  |  TensorFlow

科赛 - Kesci.com

  1. THUCNews数据集下载和探索

参考博客中的数据集部分和预处理部分:CNN字符级中文文本分类-基于TensorFlow实现 - 一蓑烟雨 - CSDN博客

参考代码:text-classification-cnn-rnn/cnews_loader.py at mas...

  1. 学习召回率、准确率、ROC曲线、AUC、PR曲线这些基本概念

参考1:机器学习之类别不平衡问题 (2) —— ROC和PR曲线_慕课手记

打卡规则

学员编号+任务名称+作业链接 (例如:01+数据集探索+www.baidu.com)

使用博客记录对数据的分析过程  主要是代码+适量的文字描述  

参考答案