参考的博客:Adaboost 算法的原理与推导
下面我主要说说我的学习过程以及其中对这个算法的一些理解和疑惑。
首先,对于这个算法的原理,我主要看上面罗列的博客和李航的《统计学习方法》。博客参考了李航的书,两者在讲解原理和举例来解释原理上比较详尽清晰。辅助资料是《导论》、周志华、O'Reilly这三本书。
对于这个算法的伪代码,我截取了《数据挖掘导论》这本书的内容:
针对伪代码提出的问题:
- 对于步骤5,如何获得多个基分类器?
- 在产生多个基分类器中,通过计算带权分类误差【步骤7】来获得基分类器的原理是什么?
- 为什么带权分类误差大于0.5,要重新从步骤4开始?
- 如何计算获得新一轮的每个特征的权重。



