下面关于ID3算法中说法错误的是() ID3算法要求特征必须离散化 信息增益可以用熵,而不是GINI系数来计算 选取信息增益最大的特征,作为树的根节点 ID3算法是一个二叉树模型
C
ID3算法(Iterative Dichotomiser 3 迭代二叉树3代)是一个由Ross
Quinlan发明的用于决策树的算法。可以归纳为以下几点:
使用所有没有使用的属性并计算与之相关的样本熵值
选取其中熵值最小的属性
生成包含该属性的节点
D3算法对数据的要求:
1) 所有属性必须为离散量;
2) 所有的训练例的所有属性必须有一个明确的值;
3) 相同的因素必须得到相同的结论且训练例必须唯一。