Skip to content

Latest commit

 

History

History
135 lines (73 loc) · 3.36 KB

File metadata and controls

135 lines (73 loc) · 3.36 KB

这是 V2.0 版本的README文档,V1.0版本请看:https://github.com/hduyyg/kaggle-Digit-Recognizer

本版本有很多新人加入,所以在knn阶段结束之前,所有的代码提交,都只能由余洋来进行pr合并,切忌不要自己合代码。

目录

主要成员角色

得分进展

版本规划

参考资料

下一版本构思

主要成员角色

角色 用户 内容
总负责人 余洋 代码pr
负责人: 健忘症 代码pr
负责人: Adam_shi_ 代码pr
负责人:

得分进展

  1. 2018-03-29 Lenet5 score=0.99557
  2. 2018-03-24 RF score=0.95371
  3. 2018-03-20 knn+pca score=0.975
  4. 2018-03-12 score=0.99285

版本规划

起始时间

2018-03-15 ~ 2018-03-31

预期目标

  1. 相较第一版,更加细致的数据分析
  2. knn、基于朴素贝叶斯K近邻的快速图像分类算法、基于图像形状的一种比较漂亮的分类算法、svm、LR、RF、卷积神经网络六种解法机器优化
  3. 得分尽可能达到100%

进度安排

周末休息,不计入进度安排时间。

  • 2018-03-17

    多种数据处理方式的尝试,包括降维方法:PCA、LDA、LLE;
    
    图片缩放、锐化等操作,减小图片,去掉模糊边缘,使图片更清晰;
    
    针对有的数字图片旋转了一定角度这个问题的处理;
    
  • 2018-03-18

    休息
    
  • 2018-03-19 score=0.975

      knn算法及优化
    
      最终采用pca+knn
    
  • 2018-03-20

      基于朴素贝叶斯K近邻的快速图像分类算法
    
      链接:http://www.oalib.com/paper/4249872
    
      结果证明,贝叶斯用在这里效果不好,连0.9都无法达到,放弃这种解法。
    
  • 2018-03-21

      基于图像形状的一种比较漂亮的分类算法
    
      链接:http://blog.csdn.net/lishuhuakai/article/details/53573241
    
      只是采用了两种新的距离计算方式,感觉没啥大用,放弃。
    
  • 2018-03-22

      LR
    
      链接:http://blog.csdn.net/Dinosoft/article/details/50734539
    
      效果目前最好的,也只在0.92附近,有点差,放弃了,不作为最终解法。
    
  • 2018-03-23

      RF
    
      链接:http://blog.csdn.net/Dinosoft/article/details/50734539
    
      最佳效果目前达到0.95371,作为最终解法之一。
    
  • 2018-03-24

    回顾消化一下之前的几种解法
    
  • 2018-03-25

    休息
    
  • 2018-03-27

    svm
    
  • 2018-03-29

      卷积神经网络
    
      采用Lenet 5,达到0.99557
    
  • 2018-03-31

      对于不同算法的结果进行分析,对于出现不同结果的数据进行分析;
    
      综合现有算法结果,得出最终解;
    
      项目第二版收尾,文档整理等等;
    
      不同基础算法的融合失败,时间所限,只能采用投票法,但效果实在差强人意。
    

参考资料

下一版本构思