2017年7月9日星期日

分类算法——adaboost算法

       学习资料:《机器学习实战》——算法实现学习;李航《统计学习方法》、《数据挖掘导论》、周志华《机器学习》、O'Reilly《Hands-On Machine Learning with Scikit-Learn&TensorFlow》——这四本主要是理论的学习。
       参考的博客:Adaboost 算法的原理与推导

      下面我主要说说我的学习过程以及其中对这个算法的一些理解和疑惑。
     首先,对于这个算法的原理,我主要看上面罗列的博客和李航的《统计学习方法》。博客参考了李航的书,两者在讲解原理和举例来解释原理上比较详尽清晰。辅助资料是《导论》、周志华、O'Reilly这三本书。
       对于这个算法的伪代码,我截取了《数据挖掘导论》这本书的内容:
        
针对伪代码提出的问题:
  1. 对于步骤5,如何获得多个基分类器?
  2. 在产生多个基分类器中,通过计算带权分类误差【步骤7】来获得基分类器的原理是什么?
  3. 为什么带权分类误差大于0.5,要重新从步骤4开始?
  4. 如何计算获得新一轮的每个特征的权重。
对于前两个问题,我找到一篇博客:关于AdaBoost的再思考。【未完待续】



没有评论:

发表评论