|
机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能。重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。 机器学习强调三个关键词:算法、经验、性能。在数据的基础上,通过算法构建出模型并对模型进行评估。评估的性能如果达到要求,就用该模型来测试其他的数据;如果达不到要求,就要调整算法来重新建立模型,再次进行评估。如此循环往复,最终获得满意的模型来处理其他数据。机器学习技术和方法已经被成功应用到多个领域,比如个性推荐系统、金融反欺诈、语音识别、自然语言处理和机器翻译、模式识别、智能控制等。 典型的机器学习算法包括分类、聚类、回归分析和关联规则等。 机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。例如,它们遇到错误时不能自我校正;不会通过经验改善自身的性能;不会自动获取和发现所需要的知识;它们的推理仅限于演绎而缺少归纳,因此至多只能够证明已存在的事实、定理,而不能发现新的定理、定律和规则等。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤其典型的是专家系统中的知识获取瓶颈问题,人们一直在努力试图采用机器学习的方法加以克服。 机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认知模型;发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析;建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。 自1956 年人工智能奠基以来, 人们非常重视机器学习的研究, 至今已经历了四个发展阶段。 第一阶段始于20 世纪50 年代中期,这一阶段的工作不少程度上受启发于神经生理学、生物学等研究,主要是研究不需要什么初始知识的通用学习系统,特别是神经网络系统。这一阶段的一个重要特点是数值表示和参数调整,不像当时的人工智能领域重心在于符号表示和启发式方法,而更偏向于模式识别。这一时期的代表性工作有感知机、生物进化过程模拟, 以及A .L .Samuel 的很有名的、曾击败过州级冠军的计算机跳棋学习程序。 第二阶段始于60年代初期,这一阶段的不少工作受到心理学和人类学习的启示,主要是概念学习和语言获取,有人称其为符号概念获取阶段。这一时期的主要特点是使用符号表示而不是数值表示。当时符号表示已成为人工智能的主要方法。另外,采用数值表示的神经网络由于M .Minsky等于1969 年发表的著作从理论上分析了感知机的能力和限制,使得这方面的研究陷入低谷。这一时期的代表性工作有概念学习系统CLS,积木世界结构学习系统。另外,在学习计算理论方面,建立了极限辨识理论。 第三阶段始于70 年代中后期,由于专家系统的成功和知识工程的形成,这一阶段的工作对知识的重要性尤其关注。一方面,领域知识大量引入学习程序之中;另一方面,知识的自动获取成为机器学习的应用目标。这一时期,机器学习逐渐走向兴盛,各种学习策略、学习方法相继出现,除了作为主流的归纳学习外,还出现了类比学习、解释学习、观察和发现学习等等。这一时期有影响的工作有学习质谱仪预测规则系统Meta-DENDRAL,利用AQ 11 方法学习大豆疾病诊断规则系统,利用ID 3方法学习象棋残局规则,数学概念发现系统AM,符号积分系统LEX,以及一系列物理定理重新发现系统BACON。在学习计算理论上,L .G .Valiant 提出了概率近似正确PAC 学习模型,这一成果推动了学习计算理论的发展。 第四阶段始于80年代中后期,主要源于神经网络的重新兴起。由于使用隐单元的多层神经网络及反传算法的提出,克服了早期线性感知机的局限性,从而使得非符号的神经网络的研究得以与符号学习并行发展。同时,机器学习在符号学习的各个方面也更加深入和广泛地展开,并形成了较为稳定的几种学习风范,如归纳学习、分析学习(特别是解释学习和类比学习) 、遗传学习等。这一时期有影响的工作有多层神经网络反向传播学习算法,基于解释的学习,一系列决策树归纳学习方法,J .H .Holland的遗传学习和分类器系统,A .Newell 等的SOAR学习系统,以及PRODIGY学习系统等。近期,由于复杂世界的实际应用的需要,出现了结合各种学习方法的集成学习系统、多策略学习技术,特别是关于连接学习与符号学习的结合。另外,有着很大应用价值的数据库知识发现学习技术也发展得很快。 机器学习经过多年的发展, 到现在已形成了很多学习方法,例如机械学习、传授学习、实例学习、发现学习、解释学习、类比学习、事例学习、遗传学习、连接学习等。 【出处】林子雨.大数据导论.人民邮电出版社,2020年9月第1版.
|