|
决策树是一种类似于流程图的树结构;其中,每个内部节点(非树叶节点)表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点(或终节点)存放一个类标号。树的最顶层节点是根节点。 如何使用决策树分类呢?给定一个类标号未知的元组X,在决策树上测试元组的属性值。跟踪一条由根到叶节点的路径,该叶节点就存放着该元组的类预测。决策树很容易转换为分类规则。 为什么决策树分类器如此流行呢?决策树的构造不需要任何领域知识或参数设置,因而适合于探测式知识发现。决策树可以处理高维数据。获取的知识用树的形式表示是直观的,并且容易被人理解。决策树归纳的学习和分类步骤是简单和快速的。一般情况下,决策树分类器具有很好的准确率。然后,成功的使用可能依赖于手头的数据。决策树归纳算法已经成功地应用于许多应用领域的分类,如医学、制造和生产、金融分析、天文学和分子生物学。决策树是许多商业规则归纳系统的基础。 【出处】韩加炜,堪博 著,范明,孟小峰译.数据挖掘:概念与技术(原书第2版),机械工业出版社,2007年3月.
|