第一代人工智能
1.1 物理符号系统假设
人类的智能行为是怎么产生的, 纽威尔、西蒙等提出以下模拟人类大脑的符号模型, 即物理符号系统假设. 这种系统包括: (1) 一组任意的符号集, 一组操作符号的规则集 (2) 这些操作是纯语法的, 即只涉及符号的形式不涉及语义, 操作的内容包括符号的组合和重组; (3) 这些语法具有系统性的语义解释, 即它所指向的对象和所描述的事态. 1955年麦卡锡和明斯基等学者, 在达特茅斯人工智能夏季研究项目的建议中, 明确提出符号 AI的基本思路: “人类思维的很大一部分是按照推理和猜想规则对 ‘词’进行操作所组成的”. 根据这一思路, 他们提出了基于知识与经验的推理模型, 因此我们又把符号 AI 称为知识驱动方法.
1.2 符号AI的发展历程
符号 AI 的开创者最初把注意力放在研究推理的通用方法上, 如 “手段 – 目的分析” “分而治之” “试错” 法等, 试图通过通用的方法解决范围广泛的现实问题. 由于通用方法是一种弱方法, 实际上只能解决 “玩具世界” 中的简单问题,如机器人摆放积木, 下简单的井字棋等, 与解决复杂现实问题相差很远. 寻求通用 AI 的努力遭到了失败, 符号 AI 于 20 世纪 70 年代初跌入低谷. 幸运的是, 斯坦福大学教授费根堡姆等及时改变了思路, 认为知识, 特别是特定领域的知识才是人类智能的基础, 提出知识工程与专家系统等一系列强 AI 方法, 给符号 AI 带来了希望.他们开发了专家系统 DENDRAL (有机化学结构分析系统, 1965∼1975), 随后其他学者相继开发了MYCIN (血液传染病诊断和抗菌素处方, 1971∼1977), XCON (计算机硬件组合系统) 等. 不过早期的专家系统规模都较小, 难以实用. 直到 1997 年 5 月 IBM 的深蓝国际象棋程序打败世界冠军卡斯帕诺夫, 符号 AI 才真正解决大规模复杂系统的开发问题. 费根堡姆和雷蒂作为设计与构造大型人工智能系统的先驱, 共同获得 1994 年 ACM 图灵奖.
1.3 符号AI在机器学习中的应用
符号 AI 同样可以应用于机器学习, 把 “机器学习” 看成是基于知识的 (归纳) 推理. 下面以归纳逻辑编程为例说明符号 AI 的学习机制. 在 ILP 中正负样本 (具体示例)、背景知识和学习结果 (假设) 都以一阶逻辑子句 (程序) 形式表示. 学习过程是在假设空间中寻找一个假设, 这个假设应尽可能多地包含正例, 尽量不包含负例, 而且要与背景知识一致. 一般情况下假设空间很大, 学习十分困难, 不过有了背景知识之后, 就可以极大地限制假设空间, 使学习变成可行. 显然, 背景知识越多, 学习速度越快, 效果也越好. 为解决不确定问题, 近年来, 发展了概率归纳逻辑编程方法. 基于知识的学习, 由于有背景知识, 可以实现小样本学习, 而且也很容易推广到不同的领域, 学习的鲁棒性也很强. 以迁移学习为例, 可以将学习得到的模型从一种场景更新或者迁移到另一场景, 实现跨领域和跨任务的推广. 具体做法如下, 首先, 从学习训练的环境出发, 发现哪些知识可以跨域或者跨任务进行迁移, 哪些只是针对单个域或单个任务的特定知识, 并利用通用知识帮助提升目标域或目标任务的性能. 这些通用知识主要通过以下 4 种渠道迁移到目标域中去, 即源域中可利用的实例, 源域和目标域中可共享的特征, 源域模型可利用的部分, 源域中实体之间的特定规则. 可见, 知识在迁移学习中起关键的作用, 因此, 符号 AI 易于跨领域和跨任务推广.
1.4 符号AI的成功要素
在创建符号 AI 中做出重大贡献的学者中, 除费根堡姆和雷蒂之外, 还有明斯基, 麦卡锡, 纽威尔和西蒙共 6 位先后获得图灵奖. 总之, 第一代 AI 的成功来自于以下 3 个基本要素. 以深蓝程序为例, 第 1 是知识与经验, “深蓝” 从象棋大师已经下过的 70 万盘棋局和大量 5∼6 个棋子的残局中, 总结出下棋的规则. 另外, 在象棋大师与深蓝对弈的过程中, 通过调试 “评价函数” 中的 6000 个参数, 把大师的经验引进程序. 第 2 是算法, 深蓝采用 α − β 剪枝算法, 有效提高搜索效率. 第 3 是算力 (计算能力), 为了达到实时的要求, 深蓝使用 IBM RS/6000 SP2, 11.38 G FLOPS (浮点运算/秒), 每秒可检查 2 亿步, 或 3 分钟运行 5 千万盘棋局.
1.5 符号AI的优势与局限性
符号 AI 有坚实的认知心理学基础, 把符号系统作为人类高级心智活动的模型, 其优势是, 由于符号具有可组合性, 可从简单的原子符号组合成复杂的符号串. 每个符号都对应着一定的语义, 客观上反映了语义对象的可组合性, 比如, 由简单部件组合成整体等, 可组合性是推理的基础, 因此符号 AI 与人类理性智能一样具有可解释性和容易理解. 符号 AI 也存在明显的局限性, 目前已有的方法只能解决完全信息和结构化环境下的确定性问题, 其中最具代表性的成果是 IBM “深蓝” 国际象棋程序, 它只是在完全信息博弈 (决策) 中战胜人类, 这是博弈中最简单的情况. 而人类的认知行为, 如决策等都是在信息不完全和非结构化环境下完成的, 符号 AI 距离解决这类问题还很远.
1.6 符号AI面临的挑战
以自然语言形式表示的人类知识, 计算机难以处理, 必须寻找计算机易于处理的表示形式, 这就是知识表示问题. 我们已有的知识表示方法, 如产生式规则, 逻辑程序等, 虽然计算机易于处理 (如推理等), 但都较简单, 表现能力有限, 难以刻画复杂和不确定的知识, 推理也只限于逻辑推理等确定性的推理方法. 更加复杂的知识表示与推理形式都在探讨之中, 如知识图谱、概率推理等. 符号 AI 缺乏数学基础, 除数理逻辑之外, 其他数学工具很难使用, 这也是符号 AI 难以在计算机上高效执行的重要原因. 基于知识驱动的强 AI 只能就事论事地解决特定问题, 有没有广泛适用的弱方法, 即通用 AI, 目前还是一个值得探讨的问题. 此外, 从原始数据 (包括文本、图像、语音和视频) 中获取知识目前主要靠人工, 效率很低, 需要探索有效的自动获取方法. 此外, 真正的智能系统需要常识, 常识如何获取、表达和推理还是一个有待解决的问题. 常识的数量巨大, 构造一个实用的常识库, 无异于一项 AI 的 “曼哈顿工程”, 费时费力.
