数据集分隔方法:留出法,交叉验证(k 折交叉验证),自助法 训练集,验证集,测试集 训练集训练,通过验证集验证,根据反馈进行反复调参,得到最终模型;测试集用来检查训练效果
accuracy 精度,准确度
T:true F:false precision 查准率:针对a分类,有多少比例被预测出来or我预测为a的结里对的占多少比例;我预测是对的分两种(分母): Ta,Fa recall 查全率:针对a分类,我预测正确的占所有a分类样本的比例。实际是对的分两种(分母):Ta,Fx
为何需要查全率,因为样本分布不均衡,多分类问题,0~9 数字识别,识别是否是 3,及时是一个垃圾模型让输出结果都不是 3,准确率仍有 90% 查准率与查全率一般情况有反向变动关系,查准率越高,相应的查全率就会降低;反过来也一样
cnn相关概念:卷积核(一般 3x3,5x5),步长(每次移动的幅度),深度(观察的角度),填充值(解决无法覆盖的特征)