智能技术

来源:互联网 发布:中国为何要建立网络墙 编辑:程序博客网 时间:2024/06/11 21:00

 

 

      智能技术是为了有效地达到某种预期的目的,利用知识所采用的各种方法和手段。目前具有重要应用价值的智能技术列举如下:

 

一、主体(agent, 代理, 智能体) 

 

      本方向要针对我国软件产业发展的需要,从建立分布式智能和分布式应用系统集成 的目标出发,在理论创新的基础上,发展公共主体请求代理体系机制CARBA,研究 面向主体软件工程方法,开发具有自主版权的目标产品"多主体环境 MAGE"。 主要研究内容包括:

 

 

理性主体的认知模型和多主体的协调策略;

 

面向主体的软件工程方法;

 

主体网格;

 

主体技术实用化研究方面。

该方向主要应用领域包括:电子商务,数字图书馆,移动计算,群体智能决策支持系统,以及CSCW。

多主体环境MAGE  

MAGE介绍

 

    多主体环境MAGE是一种面向主体的软件开发、集成和运行环境。MAGE主要基于智能主体和多主体技术,为用户提供一种面向主体的软件开发和系统集成模式,包括面向主体的需求分析、系统设计、主体生成以及系统实现等多个阶段。它提供了多种软件重用模式,可以方便地重用以不同语言编写的主体或非主体软件;它还提供了面向主体的软件开发模式,以主体为最小粒度,通过封装和自动化主体一般性质,程序员可以通过特殊行为的添加方便地实现自己的应用;这样,通过构建新的软件以及重用旧的软件,应用程序员可以方便地进行各种应用集成。具体流程如图1所示。 

 

 

1 MAGE主体平台体系结构 

 

    MAGE主体平台主要包括四个模块,即主体管理系统AMS、目录服务主体DF、一般主体以及消息传输系统MTS(在MAGE中由主体通信通道ACC实现),此外,还有两个辅助的模块为主体系统开发提供方便,即主体库和功能构件库。具体的体系结构如图2所示。 

 

 

2 主体结构 

 

    主体的基本结构主要由六大模块组成:主体内核(Kernel)、基本能力模块(Basic capabilities)、感知器(Sensor)、通信器(Communicator)、功能模块接口(Function modules)以及主体知识库(knowledge base)。具体结构如图3所示。 

 

 

3 主体声明周期 

 

    主体在主体平台中有一个基本的生命周期,如图4所示,它包括五个基本状态:初始态、活动状态、等待状态、挂起状态、转移状态。其主要生命过程为,当主体平台依据特定的主体类来创建一个新的主体时,主体就诞生了,标志其生命的开始,进入初始状态;主体通过调用则正式进入活动状态,可以执行其基本的任务与功能;当系统需要将其暂停时,则主体进入挂起状态,直到有恢复命令使得主体又回到活动状态;当执行条件不满足(如等待资源)时,则主体处于等待状态,直到该主体被唤醒(条件满足);当主体由于系统的需要开始移动到其它计算机上时,则进入转移状态,直到系统执行它时,再进入活动状态。在所有这些状态中,若系统发出终止命令,或者主体自动退出时,此时主体即完成其整个生命周期,主体将不复存在。 

 

 

 

 

二、机器学习与数据挖掘 

 

      主要研究内容包括:

 

 

学习算法: 归纳学习、范例学习、贝叶斯网路、粗糙集、模糊集、支持向量机、强化学习、关联规则、遗传算法、解释学习

 

开展感知学习、主动学习和内省学习等研究;

 

通用数据挖掘工具,如SAS, SPSS, MSMiner。

 

      BBN技术公司已获美国国防高级研究计划局(DARPA)550万美元投资,开展综合学习项目(Integrated Learning Program)第一阶段工作。未来4年里,BBN将开发一种称为“综合学习器(Integrated Learner)”的人工智能(AI)能力,该装置在被展示了一个简单例子后能学习计划或过程。如果所有4年的研制项目全部完成,公司获得的总合同价值将可达到2400万美元。

      该项目的目标是将专业领域知识和常识综合创造出一个推理系统,该系统能像人一样学习并可用于多种复杂任务。这样一种系统将显著扩展计算机能学习的任务类型。

 

 多策略数据挖掘平台MSMiner  

一、概述 

    随着国家信息基础结构建设目标的实施,企业在各种活动中普遍采用现代信息技术来提高竞争力。传统的基于数据的管理信息系统已不能满足决策者对数据质量的需求,面向决策的知识管理系统正在蓬勃兴起。管理信息系统与决策支持系统的结合是目前最为迫切需要的系统软件。适应这一要求,多策略数据挖掘平台的建设目标是开发具有自主版权的、多策略的通用数据挖掘平台,为企业决策和智能信息处理提供数据挖掘总体解决方案。系统采用功能强大的元数据作为调度中心,实现了数据仓库与数据抽取、转换、装载(ETL)、数据挖掘、;联机分析处理(OLAP)的有机集成和各种数据挖掘算法的无缝连接。系统还提供了多种数据转换规则和数据挖掘算法,全面支持企业的生产、销售、市场营销、财务管理、企业决策等领域活动,具有广阔的应用前景。同时,多策略的数据挖掘工具也可以应用于其他一些国民经济的关键领域,如税务稽查、商业营销决策、金融部门等。在本系统的研究过程和软件开发过程中充分考虑我国企业的需求和产品化问题,在国民经济的各个领域中推广应用,开发具有自主知识版权的数据挖掘软件。

 

 

 二、体系结构

 

   

  

     

 

三、语义网格和知识网格(Semantic grid and knowledge grid) 

 

      语义网格和知识网格是在异构的、动态的虚拟组织环境下,提供有效的知识服务和共享,协作解决用户需要解决的问题,满足用户的需求。 主要研究内容包括:

 

 

知识模型。知识模型将描述系统的知识和推理需求,包括领域知识、推理知识和任务知识。 

通信模型。通信模型将描述系统之间或系统与用户之间的需求和接口。 

知识获取。研究适合高维、海量、异构、不完全、半结构化数据挖掘的有效方法和算法。 

知识组织。研究通过概念语义空间进行知识组织,以期获得快速检索和高的查准率。

语义Web服务。利用语义Web技术改善Web服务,实现服务自动发现和组合。

统一逻辑。实现本体描述、服务匹配。

服务管理。面向用户服务的模式和协议。 

 

四、自主计算(autonomic computing) 

      IT系统拥有自我调节能力而无需人为的过多干预, 这就是自主计算的思想——将复杂性嵌入到系统设施本身,使用户觉察不到复杂性,只需发号施令而不必关心系统执行命令的具体过程。这意味着,系统本身能够自主运行,并自我调整以适应不同的环境。自主计算即得名于人体的自主神经系统,但它们的重要差异在于,人体做出的很多自主决定是不自觉的,而计算机系统的自主计算组件则遵循人所下达的命令。自主计算也不同于人工智能,虽然后者在某些方面对其有借鉴意义。自主计算并不将模仿人类思维作为主要目标,而是具有适应动态变化环境自我管理能力。 主要研究内容包括:

 

 

自配置。使PC可以在无人参与的情况下自动安装应用程序,可用于包括IBM或其他品牌PC的混合环境;系统移植助理则通过保存用户的设置,使用户特殊的数据、应用以及个人设置从旧系统向新系统转移时更容易。 

自恢复。它能使PC用户快速、轻松地实现文件数据乃至应用程序和操作系统本身的恢复。 

自优化。软件可以让用户轻易地在多种有线或无线的网络中切换,而不必操心网络连接时的设置变更过程。 

自保护。利用系统集成的安全芯片和客户安全软件,提供了同时基于软硬件的保护措施。 

 

五、认知信息学(cognitive informatics) 

 1.   神经计算

 

      侧重研究神经网络变换、神经场计算理论、信念神经网络模型的学习理论、基于前馈动力学神经网络的联想记忆模型、基于遗传算法的神经网络算法、神经近似逻辑、思维模型等。取得的研究成果如下: 

 

 

以指数函数为隐单元激发函数的指数神经网络模型。 

研究了变换神经网络的竞争学习问题, 提出了适应频率竞争学习算法, 推广了 K--中心聚类算法, 从而部分地解决了全局等概率性问题。 

神经场计算的理论框架, 用平坦流形上单形、 复形的概念和理论来作为神经网络模型结构的表示和编码机理, 通过复形结构的边缘链结构分解, 形成了对于神经网络层次化, 功能模块化的组织结构、 定位机理的认识。 

在非线性空间和非欧氏空间中基于整体结构逼近的学习理论框架, 在此基础上分别提出了对偶校正学习算法(DCL) 和基于拓扑结构逼近校正学习算法( TAC)。 

神经近似逻辑,该逻辑能很好地描述神经网络。神经近似逻辑不仅具有模糊的逻辑值,而且逻辑运算符也是模糊的。 

连接专家系统。

2. 学习的认知机理 

3. 环境认知 

认知科学  

      认知科学是研究人类感知和思维信息处理过程的科学,包括从感觉的输入到复杂问题求解,从人类个体到人类社会的智能活动,以及人类智能和机器智能的性质。认知科学是现代心理学、信息科学、神经科学、数学、科学语言学、人类学乃至自然哲学等学科交叉发展的结果。 

 

      认知科学的兴起和发展标志着对以人类为中心的认知和智能活动的研究已进入到新的阶段。认知科学的研究将使人类自我了解和自我控制,把人的知识和智能提高到空前未有的高度。生命现象错综复杂,许多问题还没有得到很好的说明,而能从中学习的内容也是大量的、多方面的。如何从中提炼出最重要的、关键性的问题和相应的技术,这是许多科学家长期来追求的目标。要解决人类在21世纪所面临的许多困难,诸如能源的大量需求、环境的污染、资源的耗竭、人口的膨胀等笛单靠现有的科学成就是很不够的。必须向生物学习,寻找新的科技发展的道路。

 

一、知觉信息的表达和处理 

       知觉信息的表达是知觉研究的基本问题,是研究其它各个层次认知过程的基础。 知觉过程是从那里开始的?外在物理世界的那些变量具有心理学的知觉意义? 作为知觉的计算模型计算的对象是什么?这些围绕知觉信息表达的问题是建立任何知觉和跟知觉有关的学说和理论模型, 无论是人类的还是计算机的,都必须首先回答的问题。知觉信息表达的研究可以有不同层次的问题, 包括诸如知觉组织的问题、知觉学习的问题、知觉动态记忆的问题、以及面孔识别的问题等。

      将在计算理论层次、 脑的知识表达层次和计算机实现层次上, 把认知神经科学实验研究和计算机视觉研究结合起来,将对上述科学问题提出崭新的理论(或思想)和解决的方法。

 

 

二、学习提升智能 

    学习是基本的认知活动,是经验与知识的积累过程,也是对外部事物前后关联地把握和理解的过程,以便改善系统行为的性能。

    学习的神经生物学基础是神经细胞之间的联系结构突触的可塑性变化, 已成为当代神经科学中一个十分活跃的研究领域。突触可塑性条件即在突触前纤维与相联的突后细胞同时兴奋时, 突触的连接加强。1949年,加拿大心理学家Hebb提出了Hebb学习规则,他设想在学习过程中有关的突触发生变化,导致突触连接的增强和传递效能的提高。Hebb学习规则成为连接学习的基础。神经网络是由具有适应性的简单单元组成的广泛并行互连的网络。Kohonen提出自组织映射网络。Haken根据协同形成结构,竞争促进发展的规律,将协同的非线性动力理论与神经网络有机结合, 提出了协同联想记忆网络。Amari提出用微分流形和统计推理来研究神经网络。 在Amari理论的基础上史忠植等提出了一种神经场模型,由场组织模型和场效应模型构成。

    感知学习是发生在感知水平上的学习,主要研究如何从低级的传感器输入的原始数据获取相关的抽象数据。感知学习主要考虑通过视觉和听觉的学习,研究从非结构与半结构信息到结构信息变换方法,研究图像的语义描述及其快速提取技术,研究感知学习中的注意机制与元认知等。

     认知学习理论认为在人的行为背后都有一个相应的思维过程,行为的变化是可观察的,并且通过行为的变化也可以推断出学习者内心的活动。在认知学习理论中,如Ausubel提出的有意义学习理论(又称同化理论),其核心思想是获得新信息主要取决于认知结构中已有的有关观念;意义学习是通过新信息与学习者认知结构中已有的概念相互作用才得以发生;由于这种相互作用的结果,导致了新旧知识意义的同化。Gagne提出的信息加工学习理论则将学习过程类比成计算机的信息加工过程,学习结构由感受登记器、短时记忆、长时记忆、控制器、输出系统组成,认知过程可分为选择性接收、监控、调节、复述、重构。在这个信息加工过程中,非常关键部分是执行控制和期望。执行控制是指已有的学习经验对当前学习过程的影响,期望是指动机系统对学习过程的影响,整个学习过程都是在这两个部分的作用下进行的。

     内省学习是一种自我反思、自我观察、自我认识的学习过程。在领域知识和范例库的支持下,系统能够自动进行机器学习算法的选择和规划,更好进行海量信息的知识发现。

     内隐学习就是无意识获得刺激环境复杂知识的过程。在内隐学习中,人们并没有意识到或者陈述出控制他们行为的规则是什么,但却学会了这种规则。在80年代中期之后,内隐学习成了心理学界、尤其是学习和认知心理领域最热门和最受关注的课题,成了将对认知心理学的发展产生深远影响的最重要课题之一。内隐学习具有以下三个特点:

 

 

内隐知识能自动地产生,无需有意识地去发现任务操作的外显规则;

 

内隐学习具有概括性,很容易概括到不同的符号集合;

 

内隐学习具有无意识性,内隐获得的知识一般不能用语言系统表达出来。

 

 

三、语言开启智能之门 

    人类进化过程中,语言的使用使大脑两半球功能分化。语言半球的出现使人类明显有别于其他灵长类。一些研究表明,人脑左半球同串行的、时序的、逻辑分析的信息处理有关,而右半脑同并行的、形象的、非时序的信息处理有关。

     语言是以语音为外壳、以词汇为材料、以语法为规则而构成的体系。语言通常分为口语和文字两类。口语的表现形式为声音,文字的表现形式为形象。口语远较文字古老,个人学习语言也是先学口语,后学文字。

      语言是最复杂、最有系统、而应用又最广的符号系统。语言符号不仅表示具体的事物、状态或动作,而且也表示抽象的概念。汉语以其独特的词法和句法体系、文字系统和语音声调系统而显著区别于印欧语言,具有音、形、义紧密结合的独特风格。概念是反映事物的特有属性的思维形态,概念与语词有密切的联系。概念的产生和存在,必须依附于语词。语词所以能够表示其它事物,就是由于人们头脑中有相应的概念。所以,语词是概念的语言形式,概念是语词的思想内容。

      从神经、认知和计算三个层次上研究汉语,给予我们开启智能之门极好的机遇。汉语的认知心理学研究已有多年历史,取得了世界一流的研究成果。但这些研究多侧重于汉字与词汇,对更高层次的句法和语句加工尚需深入探讨。对整个言语链的研究还不够系统,特别是对脑的语言加工机制知之不多。在智能系统领域,我国对汉语计算机信息处理极为重视,曾投入大量资金,支持计算语言学、机器翻译和自然语言理解系统的研究和开发,取得了一大批重要成果。但就整体而言,语言信息的智能处理存在许多悬而未决的问题,其解决必须需要以认知科学的研究为基础,以新的理论为指导才有可能取得突破。

     1991年Mayeux 和Kandel在Wernicke-Geschwind模型基础上提出新的语言信息处理模型。听觉输入的语言信息由听皮层传至角回,然后至Wernicke区,再传到Broca区。视觉输入的语言信息直接从视觉联合皮层传至Broca区。对一个词的视知觉与听知觉是由感觉模式不同的通路相互独立地处理的。这些通路各自独立地到达Broca区,以及与语言含义和语言表达相关的更高级区域。大脑中语言处理通路的每一步工作机理都有待深入研究. 

     用数学方法研究语言,寻找语言结构的形式、模型和公式,使语言的语法规则能象数学符号和公式一样具有系统化、形式化的特点,可以用来生成无限的句子。美国著名语言学家Chomsky于1956提出了语言的形式文法,为语言信息处理建立了理论基础。 1996年,Yip和Sussman提出在语音学规则中使用双向约束传播机理,可以解释神经水平的听觉信号怎样对应思维层次的符号。子午线交换机

 

 

四、工作记忆蕴藏智能的玄机 

    记忆是人脑对过去经验中发生过的事物的反映,是新获得行为的保持。由于记忆,人才能保持过去的反映,使当前的反映在以前反映的基础上进行,使反映更全面、更深入。也就是有了记忆,人才能积累经验,扩大经验。

    人类记忆有三种类型:感觉记忆、短时记忆和长时记忆。刺激作用停止后,它的影响并不立刻消失,可以形成后象。视觉后象最为明显。后象可以说是最直接、最原始的记忆。后象只能存在很短的时问,如最鲜明的视觉后象也不过持续几十秒钟,这就是感觉记忆。短时记亿的时间间隔比感觉记忆的要长些。但是,存储材料的时间也只有一分钟左右,或者甚至更短些。长时记忆是指保持时间在一分钟以上信息存储。人类的记忆可以分为过程记忆和命题记忆。过程记忆是保持有关操作的技能,主要由知觉运动技能和认知技能组成。命题记忆是存储用符号表示的知识,反映事物的实质。命题记忆更进一步分为情景记忆和语义记忆。前者是存储个人发生的事件和经验的记忆形式。后者是存储个人理解的事件的本质的知识,即记忆关于世界的知识。

    1974年,Baddeley和Hitch在模拟短时记忆障碍的实验基础上提出了工作记忆的三系统概念,用“工作记忆”代替了原来“短时记忆”的概念。Baddeley认为工作记忆指的是一种系统,它为复杂的任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信息,工作记忆系统能同时储存和加工信息,这和短时记忆概念仅强调储存功能是不同的。工作记忆分成三个子成分,分别是中枢执行系统、视空初步加工系统和语音环路。大量行为研究和神经心理学上的许多证据表明了三个子成分的存在,有关工作记忆的结构和作用形式的认识也在不断地丰富和完善。人们发现工作记忆与语言理解能力、注意及推理等联系紧密,工作记忆蕴藏智能的玄机。格雷特交换机

 

 

五、注意是智能的开关 

    50年代中期以来,随着认知心理学的兴起,人们重新认识注意在人类大脑信息加工中的重要性,提出了若干注意模型。其中有代表性的是注意的过滤模型和衰减模型,它们属于知觉选择模型。这两种模型把注意机制定位于信息加工的知觉阶段,在识别之前实现信息选择。与知觉选择模型形成对照的是反应选择模型,它认为注意的作用不是选择刺激,而是选择对刺激的反应。该模型认为,所有的信息都可以进入高级处理阶段,但只有最重要的信息才会引起中枢系统的反应。这两类模型的侧重点不同,知觉选择模型强调集中注意,而反应选择模型则注重分配注意。两者争论的焦点是注意机制在信息加工中的位置。注意的中枢能量模型就是在这一背景下产生的。该模型的理论基础是信息系统的有限加工能力。它避开了注意机制在信息加工中的位置这个难题,使知觉选择模型和反应选择模型的实验结果在形式上得到了统一;但缺点是没有揭示注意所涉及的信息加工过程。

     随着脑成像技术和神经生理研究的迅速发展,使得把注意网络从其他信息处理系统中分离出来的努力成为现实。利用正电子断层扫描(PET)和功能磁共振成像(fMRI)技术,可以较精确地测量在完成特定的注意任务时大脑各区域脑血流的变化(rCBF),从而确定各个注意子网络的功能结构和解剖定位。 80年代初期,Treisman提出的特征整合模型把注意和知觉加工的内部过程紧密地结合起来,并用“聚光灯”形象地比喻注意的空间选择性。根据这一模型,视觉处理过程被分为两个相互联系的阶段,即预注意和集中注意阶段。前者对视觉刺激的颜色、朝向和运动等简单特征进行快速、自动的并行加工,各种特征在大脑内被分别编码,产生相应的“特征地图”。特征地图中的各个特征构成预注意的表象。预注意加工是一个“自下而上”的信息处理过程,并不需要集中注意。特征地图中的各个特征在位置上是不确定的,要获得物体知觉就需要依靠集中注意,通过“聚光灯”对“位置地图”进行扫描,把属于被搜索目标的各个特征有机地整合在一起,实现特征的动态组装。1989年, Gray指出集中注意可以引起与被注意事件相关的神经元的同步发放,同步发放通常表现为40周左右的同步振荡。这一发现为注意的特征整合模型提供了神经生理证据。

     根据已有的研究结果,Posner把注意网络分为三个子系统:前注意系统、后注意系统和警觉系统。前注意系统主要涉及额叶皮层、前扣带回和基底神经节。后注意系统主要包括上顶皮层、丘脑枕核和上丘。警觉系统则主要涉及位于大脑右侧额叶区的蓝斑去甲肾上腺素到皮层的输入。这三个子系统的功能可以分别概括为定向控制、指导搜索和保持警觉。 

 

六、意识是智能的控制中枢 

    意识也许是人类大脑最大的奥秘和最高的成就之一。自1879年现代心理学建立以来,意识就成为心理学的主要研究对象。 James认为,心理学是研究意识的科学。但由于方法问题,不可能对意识进行具体的科学研究。 20世纪20年代兴起的行为主义心理学,不承认意识的存在。50年代出现的认知心理学重新提出意识问题,并且从知觉和觉知入手研究意识。对知觉的研究已取得较大的进展,但目前对觉知及其它问题的研究仍处于初步阶段。

   对意识给予统一、确切的科学定义在当前是十分困难的。不同的领域,对意识的理解也是不同的。诺贝尔奖获得者Crick认为,意识所涉及的是注意和短时记忆相结合的神经机制,可以用科学的方法去研究[4]。Crick关于意识的惊人假设和通过视觉注意和短时记忆研究视觉意识的具体建议,引起了大批认知心理学家、神经科学家和计算神经科学家的广泛兴趣。

     80年代末90年代初在视觉生理研究方面有一个重大的发现:从不同的神经元的发放中记录到同步振荡现象,这种大约40Hz的同步振荡现象被认为是联系不同图像特征之间的神经讯号。 Crick和Koch提出视觉注意的40Hz振荡的模型。并推测神经元的40Hz同步振荡可能是视觉中不同特征进行“捆绑”的一种形式。至于“自由意志”,Crick认为它与意识有关,牵涉到行为和计划的执行。

     另一位诺贝尔奖获得者Eccles,热衷于意识问题的研究。他与哲学家Popper合著的“自我与大脑”一书中,发表了“三个世界”的哲学观点。认为世界1包括所有物质世界(大脑也在内),世界2包括人的精神世界,世界3包括人的社会、语言、科学、文化等活动。他后期的著作中,根据神经系统的结构和功能,提出“树突子”(dendron)的假设,树突子是神经系统的基本结构和功能单元,由100 个左右顶部树突构成。估计在人脑中有40万个树突子。他进而又提出“心理子”(Psychon)的假设,世界2的心理子与世界1的树突子相对应。由于树突中的微结构与量子尺度相近,所以量子物理有可能用于意识问题。

     意识是一个复杂的问题,应该找一个切入点,并且结合当前可用的技术手段进一步深入地研究。研究意识可以将觉知(awareness)和非觉知作为切入点,找到神经相关物在脑活动中的区别。

     实际上还有一个情感系统,近年来呈现活跃的研究态势。免疫系统与智能也有密切的关系,限于篇幅,这里就不展开讨论了。