作者:非妃是公主
专栏:《机器学习》
个性签:顺境不惰,逆境不馁,以心制境,万事可成。——曾国藩
专栏地址
专栏系列文章
决策树学习基本知识
决策树学习基本算法
上面是一个递归调用的过程
决策树学习常见问题
最佳划分的度量问题
选择能使熵最大减小的属性
结合图像理解三个指数
熵x
∈
\in
∈[0, 1]:
基尼指数x
∈
\in
∈[0, 1]:
做一条辅助线就会发现:越靠近中间,红色的线越长,说明我们熵是越大的
误分类率x
∈
\in
∈[0, 1]:
C4.5决策树算法
从图像可以理解:属性分布越均匀,SplitInfo越大
加上下面六种统计信息增益度量的方法,一共存在9种
堂兄弟姐妹类型可以不同
处理确实属性值问题
处理连续属性值问题
离散化
叶子结点判定问题
怎样解决过拟合问题
待测样本分类问题
决策树学习理解解释
决策树表达为析取表达式(可解释性):
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/130535.html