第六代计算机——人工神经网络计算机是一门涉及计算,经科学的新兴学科。计算神经科学可以通过生理学或工程学对大脑如何获取及处理信息进行计算方法的研究。近几年来,神经网络计算机研究发生了突破性的进展,使我们有更大的兴趣了解大脑的计算性能,认识形成研制人工神经网络计算机热潮的背景,评估第六代计算机将对计算神经科学以及智能工业兴起的积极作用。
一、人工神经网络计算机、计算神经科学与信息社会
计算神经科学的目标是要定量描述出人类大脑是如何通过各种信号(如,电、化学信号等)来表达信息和处理信息的。人工神经网络计算机则是一种模拟人脑的超分散与超平行信息处理系统。它不仅具有自学习和自组织功能,而且还不需要用复杂程序启动。所以人工神经网络计算机可以成为神经科学研究中涌现的更强有力、更富有代表性的计算装置。
我们简单回顾一下计算机的发展史,世界上第一台电子计算机是1946年在美国的宾夕法尼亚大学里诞生。它是由18800个电子管组成的重30多吨的庞然大物,这是第一代电子计算机。60年代初,生产出第二代晶体管的电子计算机。到60年代中期,人们又生产出第三代半导体集成电路的电子计算机,70年代,第四代大规模集成电路的电子计算机问世。在1981年5月,日本等国家宣布进行开发超大规模集成电路的,即智能化的第五代电子计算机。正当日本科学家全神致力于研究第五代计算机之际,美国的教授们已把眼光集中到了第六代计算机的设计研究上。这一种速的发展,使人们不得不要静心客观地分析一下人类社会和人工神经网络计算机之间存在的相互作用以及计算神经科学对信息社会的影响。
现在,至少有四个因素正在积极促进着第六代计算机技术从概念走向现实。
第一,以下一代信息为基础的技术将是能实时、大容量处理信息,还具备人脑运算、识别、学习、记忆、联想等功能。依靠这种崭新技术可促进自然科学的变革、概念的更新和新的方法论的建立。例如,非线性科学和复杂系统理论的研究,使人们能_探索到复杂行为里的一般模式和规律。耗散结构理论、协同学与突变论是非线性复杂系统的三个重要方面。系统的耗散结构实质属于一种“活”的结构形式,它通过不断地摄入负熵来维持其自身的“新陈代谢”,所谓“耗散结构”则是一种远离平衡状态的非线性的开放系统,能够形成自组织结构。协同学提出开放系统的自组织过程是由于子系统的协同作用。有序结构在相空间的目的点或目的环是行为的目标。在给定环境中,系统只有到达目标之后才是稳定的。突变论便是以突变方式描绘在非线性的复杂系统演变过程中,新质、旧质以突变形式替代的过程。
由于要用目前的数字计算机来快速解决非线性复杂系统中的数学问题还存在着障碍,故许多科学家试图依靠第六代计算机来完成这些问题的求解。一旦在计算上有所突破,必将会给自然科学中各个学科的发展带来意想不到的影响。
第二,全球变化计划(IGBP)和世界气候研究计划(WCRP)是直接关系到人类生存的至关紧要的大问题。由于,人口的大幅度增长而带来消费不断上升,以及生态环境逐年不断地遭受破坏,再加上近10年来世界范围的气候异常,导致水资源、能源出现危机,大片土地干漠化,粮食减产。据有识之士估计到2000年后,地球上所有物种的百分之十五至二十有可能将会灭绝。所以,发展世界范围的气候动力学和气候预测的理论研究,开展人与资源、生态环境系统研究实为当今人类紧迫任务。
从一定意义上分析,人口问题,生态系统,大气/海洋环流和自然灾害的诱发起因都是文系统的行为,如分岔、混浊、突变、自组织、孤立子等等。只有深入进行非线性复杂系统的研究,才能使人类站在更高的层次上认识资源的人口承载能力,人与资源环境系统的失调问题,气候系统的本质,未来生存环境的变化预测与对策以及生物群落的信息分析与优化管理
第三,世界高科技竞争已成为多国争雄的新势态。目前以美、日间最为激烈,西欧也积极参与。当然,不仅发达国家在认真制定高技术发展战略,而且发展中的国家也竭力寻找开发高技术、跟踪高科技的途径。因为,从政治家到各界有识之士都已经树立起了一个不容疑惑的观念——一个国家的实力与国际地位的衡量标志,便是本国高技术的发展水平。正如1986年,美国商业部在一份报告中所分析的那样:“高技术的优势地位,保证了美国在世界政治和经济中的领导地位。失去这种优势地位,就有可能给美国的经济、政治和国家安全造成无法估量的影响。”
纵观世界各国的高技术计划,尽管研究目标各不相同。然而,智能计算机技术的研究(包括人工神经网络计算机的基础及应用研究)均为各国制定高技术计划的核心项目。可以这样断言:智能计算机的发展将是决定高技术成功与否之本。
第四,高技术的成果能形成新的产业,创造出新的经济财富。现在人们根据信息领域的发展已预测到,21世纪将会有一个特别引人注目的新产业诞生,即智能产业。它由智能计算机和智能应用系统丙大部分组成,单就智能计算机的产值而言,估计它会超过2500亿美元。无怪乎,美国斯坦福大学教授、人工智能的奠基者之一——费根鲍姆(Feigen-baum)指出:这是在争夺金山,决定着下一世纪的力量对比,它如同60~70年代争夺中东石油一样重要。
应该看到,这一场全球性以技术为基础的贸易竞争早已拉开序幕。日本是最有长进的国家,她立足于原有技术的巧妙运用和改进,走出一条失误较少的技术开发之路。从战后到80年代初期,日本的电子计算机硬件技术已超过美国,一些技术密集型产品(精密机械、电气机械、精细化学等)出口额达70%,也大大超过了欧美各国。但是,竞争仅是开始。80年代后期,美、日又在第六代计算机研究上展开了激烈的“争夺战”,互相投入了大量的资金和大批优秀科研人才。比如,美国国防部的“高级研究计划局”(DARPA)宣布从1988年11月起执行一项发展人工神经网络计算机的计划,投资4亿美元。而日本通产省各民间企业(富士通、日立、东芝、三菱等公司)一起投资了300亿日元,由1989年开始研究一种超分布、超并行的人工神经网络计算机。
10年以后真实的结局如何?我们在此很难预料。可是,根据人工神经网络计算机如此快的发展,以及又有数理基础科学和高技术的支撑,全球性研究和对新产业、新产品的需求刺激下,第六代计算机一定能够克服重重困难,成为推进即将来临的智能革命的巨大动力。其社会意义绝不亚于历史上曾因引起工业革命而留名的“机器”。
二、计算神经科学和第六代计算机相互间的影响
众所周知,计算神经科学的进展,使我们对大脑的信息处理进程与机制有了一定的了解,为第六代计算机的研究奠定了基础。反之,人工神经网络计算机的发展,也促进了多学科(如神经生理学、计算机科学、生理物理学、心理物理学、数学、物理学、系统工程学等)联合起来研究脑模型。我们认为,人工神经网络计算机并不是大脑的简单仿真,而是基于认知科学和人工智能成就,运用光信息处理、生物分子计算和超大规模集成电路等技术来展开“智能本质”的研究。因此,讨论计算神经科学和人工神经网络计算机之间的相互关系应该着重在以下三个方面:大脑视觉平行信息处理功能、神经元与神经网络以及脑模型。
1. 大脑视觉平行信息处理功能
虽然,迄今为止人类离开了解大脑的全部功能还存在很大的差距。但是,为确认人的视觉系统(包括眼睛与大脑)是一个超平行信息处理系统却已提供了许多宝贵而可靠的科研数据与资料。
例如,现代社会有许多精巧的传感器,比如电视摄像机、红外热成像仪和激光雷达等等,但是,它们只能将其所见的物像拍摄不来,并不能对其所获取的图像进行识别与处理。然而,人的视觉系统则不然,它不仅能真实地看到眼前的一切,而且还能够分辨出图像中千变万化的目标与背景;理解及分析图像中所包含的丰富意义和联想起各种有关联的知识。这一些能力都是由于人脑具有同时平行处理大量信息的功能。
美国哈佛医学院神经生物学教授列富英斯通(M · S · Livingstone)近来有新的发现,可进一步说明上述观点。具体地讲,视觉信息不是由单一的阶层系统进行处理的,而是被馈送到脑的若干个各有独特处理功能的独立系统中去。由于大脑约有140亿个神经细胞,而且每个神经细胞又与大约1000个神经细胞相联系。所以,尽管神经冲动的传递速度只与声速(300 m/s)的量级相当,然而它却能够圆满地处理各种信息,这一特点完全是受惠于神经网络细胞的超平行以及能进行模糊信息处理的能力。不言而喻,神经网络计算机要具备实时处理图像信息和快速进行模式识别的特性,其关键技术之一是要建立不少于1000个神经元的神经芯片。在这些人工神经元组成的系统中,突触的最大数要有100万个。利用最新的VLSI技术来完成这样规模的连线也是不易的,如果采用光电混合信号处理方法可能是当前最见成效的一种技术途径。
2. 神经元与神经网络
生理物理学家认为,神经元是大脑的基本加工单元。它们从形态上可以分为神经末梢和由细胞核、细胞体与树突组成的三部分,其中树突是神经元的输入器,它可以呈现为树枝状的若干分枝作为多路输入;轴突是连结上述两部分的细长纤维管体,其长度约1 mm到lm之间不等,直径在0.1 um到1 mm之间,传导率约为100 m/s。
这里,简要描述神经信号是如何通过连接两个神经元的突触进行传递的:当信号产生,即一种极微小的“动作电位”从细胞体发出,经过细长的轴突到达神经末梢,触及一个烧瓶形状结构——突触终末。该终末的小泡能够释放出一种神经递质,递质可以穿过突触间隔扩散,使突触后的树突(一种容受性纤维)与受体结合,诱发出一个新的电信号。
神经网络则是一种具有“有向图拓扑”结构形式的动态联结系统,它利用连续的及周期性输入的状态响应来实现信息处理。因此,神经网络是大脑对各种感觉所提供的信息进行筛选与分析理解的基础。复杂的神经网络可能会对脑的运行带来重要意义。
为了研究人工神经网络计算机,首先要考虑其硬件的发展,即神经元、突触等元件的研制。其次还要顾及到低功耗,快速响应和工艺技术条件的保证作用等等。按照生物神经网络的工作模式来设计的人工神经网络应由下面五个环节组成:
(1)有一组结构类同的基本加工单元,即神经元;
(2)在两个加工单元之间存有带权重的联接;
(3)每一个加工单元都存在一个激励电平或称状态;
(4)工作时,每一加工单元将本级的所有输入乘上联接权重,并输出一个非线性函数;
(5)通过改变联接权重可以进行学习。
目前,人们正在积极研制可动态控制突触连接强度的光学元器件,或称作为空间光调制器(SLM)。利用量子阱与量子线拉伸的精细制作工艺技术有可能在不太长的时间里制造出量子神经器件。毫无疑问,从工程技术角度出发,不断分析与应用计算神经科学研究中的新成果对人工神经网络计算机的开发研究定会带来新概念、新思想与新方法。
3. 脑模型
经过数十年对大脑的研究,已发现神经系统分子层次和系统层次之间还存在很多难以掌握的组织层次。而且这些层次各有特定的功能。例如,在低层次的结构成分中找不到的一种特性,通过它们之间的相互作用和自组织过程,可以在高层次上产生出来。另外,从心理物理学方法研究得知,感觉能力则是在大脑内,位于一系列不同通道和核团上的功能单位里大量的神经元共同活动的结果。因此,只采用研究单个神经元的办法企图探索大脑神经网络结构的性能和某一种神经元的活动与感知之间的联系,显然是不现实的。
为了有效地揭示大脑的信息处理功能,计算神经科学的一个主要研究内容便是建立脑模型。依靠脑模型来完成一些在活体上不能实现的或难以实现的科学实验。例如,研究突触,神经元或通路做选择性损伤试验等等。现在,在单个神经元层次上,模拟的事例是枪乌贼巨轴突中动作电位的霍奇金-赫胥黎(Hodgkin-Huxleg)模型。这一动作电位是沿轴突传递从而完成长路程信息通讯的瞬时间里的电活动。霍奇金和赫胥黎认为:“由于动作电位是膜通道的电压依赖关系与时间依赖关系的产物,因此对膜通道的动力学,可以用一组非线性微分方程组来建模,并计算出它的数值解。”
然而,在网络层次上的真实模型的范例是鲎眼的哈特林-雷蒂夫(Hartline-Ratliff)模型。这个模型表明视网膜中的相邻光感受器之间存在侧抑制突触的相互作用,因而光照增强了明暗边缘之间的反差。由于这种相互作用接近于线性关系,所以该网络模型也能用数学作详尽的分析。
阐明人脑的信息处理机制,探讨人类的认知活动,是认知心理学、脑科学、计算机科学、物理学、数学、神经生物学、科学语言家和哲学等学科的一个新兴交叉学科。目前,更多的事实证明,冯 · 诺依曼(Von Neumamn)计算机不是人类智能的恰当模型。第六代计算机把人工神经网络的工作原理引入探索形象思维模型与体系结构,从而达到重视人类的智能行为。所以,人工神经网络计算机的研究使人工智能与认知科学这两大领域的工作真正作到了相互交融,互为补充的地步。
三、计算神经科学的地位与展望
计算神经科学如同其它科学的建立一样,都是由它的问题空间和大量对应的成功理论所确立的。以往,人们主要是出于功能考虑而提出各种脑功能模型,因此只能对脑提供极其一般性的理论解释。诚然,这主要也局限于信号获取与生理解剖学的水平。近几年来,随着世界三大高技术(光电子技术、超导材料与生物工程)的发展,计算神经科学的地位也发生了巨大的变化,即它能为新兴科学技术的发展提供坚实的基础研究依据和广泛的实际应用前景:
1. 微观器件同宏观功能模拟的结合
这里提出的微观器件是指分子与量子层次的器件,把通过分子、细胞技术所得到的微观水平上的知识与由行为研究获取的系统水平上的知识有机地联结起来,共同解决自然界中问题的求解,进而实现模拟生物信息处理的智能计算机。
在1986年,康拉德(M · Conrad)研究了酶分子之间的特异性结合,并且还分析一种基于模式匹配的分子信息处理过程,提出了分子计算原理。在1979年卡特(F · L · Carter)针对生物体中信息处理过程的模拟,创造出分子器件与孤子开关原理,我国东南大学以韦钰为首的科研人员也研究出一种新颖的分子光电开关模型,它能模拟生物体中光-化学能,光-电信号之间的转化过程。尽管分子器件的研制还刚刚起步,但它在信息处理领域里,和电子器件、半导体器件以及光子器件一样将会给计算机科学的发展带来令人振奋的动力。
2. 智能化传感器
智能化传感器不仅具备探测、获取信息的功能,而且还有信息处理和模式识别的能力。换言之,它是一种一体多功能的传感器。例如,把硅、砷化镓集成制作成高性能的多功能处理机,它运用光-电技术可以同时完成信号处理、图形匹配、目标自动识别以及对敌方威胁及时作出自适应反应等。其中,人工神经网络是关键技术之一,它可以实时执行许多模型预处理变换和模式识别操作,还可以处理空间模式(图像、能谱……)和空间时间图像,即图像流(动态的视频图像、连续语音、雷达或声呐的多普勒数据等)。
美国国防部国防高级计划局(DARPA)正积极组织有关科研机构进行应用开发研究:开展人工神经网络同其它技术的性能对比试验从而确定其长处;加强应用基础研究,从理论和实验结果出发,确认人工神经网络的功能;为研制专用人工神经网络计算机开发研究相应的硬件技术。预计到2000年,人工神经网络技术将在下一代灵巧武器系统中得到应用。
3. 随机模式识别与实时知识处理
人工神经网具备传统的知识库系统所不具有的实时知识处理与随机模式识别的功能。由于实际情况中存在许多模糊、不确定性、矛盾以及错误的信息,通过人工神经网络可以快速组合数据并形成最优映射函数。因此人工神经网络将会在管理、医疗卫生、机器人、通讯等领域中较快获得应用。
例如,医学界利用安德生(Anderson)神经网络知识处理系统能够把每一病例编码及所具有的症状、诊断、治疗和治疗后的反应等多种属性“知识”,用一个矢量来进行处理。这个系统可以非常可靠地处理各种矛盾的或丢失的信息数据,依靠该系统能直接从病人的实际状况中得到精确的数据。它能运用“证据权”和现有属性间已知联系程度来有效解决信息矛盾与局部丢失的问题。再比如、运用科斯柯(Kosko)模糊认知映射系统处理不精确的甚至错误的信息数据。这个人工神经网络以类图结构组成,它可以存贮作为变元概念的客体之间的因果关系。所以它非常适合那些基本个体交互知识的复杂系统或组织的模型建立。
4. 控制应用
利用人工神经网络的自组织与自学习的能力,可以成功地学会平衡一个干扰抑制器的控制算法。如,格罗斯贝格/古帕尔斯坦(Grossberg/Kuperstein)的视觉运动控制神经网络,它能够执行传动器表面的一个图像传感器的反馈控制和图像平面的非线性特征的计算。简而言之,这一人工神经网络系统有能力做到把图像传感器牢牢地瞄准住我们感兴趣的运动目标。还有一个例子,利用名叫罗密尔赫塔/威廉斯(Rumelhart/Williams)反向传播神经网络可以近似表现出任意空间的映射能力。美国的约翰 · 霍普金斯大学的塞奇纽斯基(T · Sejnowski)运用该网络成功地建立起了性能优异的语音合成系统。但最值得注意的是把它运用到先进的飞机的控制系统中去,这种网络可以使模拟器从飞行员处直接学会控制规律。然后,这一网络便可“坐镇”一般的稳定性增强与控制安全性系统,还可以负责决定操纵杆的“感觉”和各种飞行控制的响应。总之,人工神经网络系统可以为自适应控制系统提供崭新的技术途径。