《认知科学》学习心得
——开始认识自己
从知道,接触到了解认知科学,时间已过去半年。学期间零零散散的看了一些,直到这个暑假才粗略的将整体看了个大概。模糊地知道这是什么,粗略地了解到我们要干什么,但是目标很明确地是为了什么。但是因为暑假学校还有一些其他的事情要做,可能学的不是很仔细,只能说是自己的一点点体会。细节的知识点自己掌握的很不牢,只是站在宏观的概念,思考逻辑有一些小小的感悟。当中存在很多的理解,认识错误,望见谅。
一.我所理解的认知科学
从认知神经科学,神经科学,到认知心理学,这些跨学科领域所关注的方面,观察角度和所用的工具皆有所区别。认知心理学关注的是外在物体或概念的内在表征以及对其的操作,而认知神经科学更多的是关注其物理层次,而反过来,它也可以作用于认知心理学的表征操作过程(如盲人阅读盲文时的初级,次级视皮质的增强)。而我所以为的认知科学,通过这半年的学习,认为它概括的说是“认识自己,知觉自然”,很笼统,但是我觉得有一定的概括意义。既然是站在科学的角度上思考问题,那就是要符合自然的规律,人也不例外(既然生命是这个宇宙的一部分,我总觉得它要符合自然的某些规律)。认知科学就是要了解我们是如何接受信息,处理信息,表达信息(我觉得信息的范围很广,如世界知识,情感,内隐操作等,有点信息加工的思想)。
二.历史
从现今的认知科学来看,其既然已经作为一门科学,当然就要符合科学的机理,或者说含有科学的概念系统。所谓科学,我对它的理解就是“自然(宇宙)的逻辑”,以往的时候,科学诞生的几百年前,唯心或多或少占主要地位,而我们认识自然的方式也仅仅是自己的主观意识(当然含有一定的客观存在)。而自科学诞生以来,实验,一种验证我们思维逻辑,机理假设正确性的存在“统治”了一切。不管是数学,物理,化学,甚至是进化论。故而,从另一方面讲,认知科学之所以叫认知科学,我觉得,客观存在导致的客观规律,实验的验证,认知心理学范式的逻辑推理,都是它的主要部分。
回顾认知学的历史,从认知的零部件(结构主义)到协同工作机制(机能主义),从发展的角度看,产生了发生认知论,再到过去强调心理的客观性(行为主义),进而发展到格式塔的整体观。简单的看到这些,可以稍微发现,认知学的历史也是人认识一般物体的过程,从部分到整体,从结构到功能等。
而在认知心理学的研究范式中有信息加工方法,联结主义方法,进化论方法,生态学方法等,它们都关注认知的不同方面,侧重点不同,有偏重信息处理过程,微观处理结构到宏观的转化(关注“硬件”),以及发展的角度和环境的影响。它们所关注的各有其理,但是如何选择,我觉得还是要在前人经验和自己大量试验后的经验总结中的得以发现。
以上是认知心理学的发展历程,从中可以看出在研究中的对认知心理学的另一种认识过程,也能够看出观察角度的不断变化所带来的不同方面的好处。在另一方面,对认知神经科学的认识较潜,通过一系列神经学方法定位活动区域(包括单细胞,本质层面)以及从定位间接地推断出未知的功能(我认为较为重要)。而其发展历程也经历了从部分到整体。我认为虽然这过程是可以总结甚至是可以预知的,但是这确是不能逾越的。经历的,虽然在最终验证为不正确,但是其带来的思想和知识却是可以影响以后发展的。
以上是我对认知科学历史一点浅浅的认知及小结,重溯历史,总能找到新的发现,我觉得认知更是这样。
三.感觉和知觉
涉及到具体的知识,我开始不知道怎么写,知识掌握的很不牢固,反反复复看了几遍,总是停留在惊叹前人的成果,当然更多的是惊异于人体自身的奇妙。人体的听,嗅味,躯体,视知觉等分工明确,但又相互联系。拥有各自的感受器,神经通路,而最终汇集到大脑皮质层。这些感觉器官是人接收信息的窗口(远远比计算机种类多,键盘,鼠标等,但还有internet)。丘脑使除嗅觉信息外其他信息的中继(不知是否准确,因为上丘参与了对运动的控制和定向,包含了在视觉域,听觉域,和触觉域的有规则的环境拓扑图),信息汇总到这里,再发向大脑皮层。
我在大二期间学过一些声音降噪方面的知识,也用过微软公司出的kinect产品。但是它的效果不是很好(已研发很多年),是否是因为它没有关注认知学这方面?仓鸮的例子就很能说明问题,Konishi提出的同步探测器模型可以独立的从时间和强度来定位水平和竖直位置,但是三维空间是需要三个坐标的,另外一个坐标是如何获取的呢?在视知觉方面,我也一直有个疑问,从2亿多视觉细胞到达200万的神经节细胞,信息是如何被压缩的?最后却又能恢复原始信息,进行表征,它所涉及的双极细胞中间层是又是如何工作的呢(计算机科学有句名言:“计算机科学领域的任何问题都可以通过增加一个间接的中间层来解决”,看来,人的认知物理层次也是这样)?而在上丘和枕核的问题上,它们的10%信息量是如何在神经节中采样得到的?它的采样机理是什么以至于能够在视觉注意中起到如此巨大的作用。
从单细胞角度来看,视细胞的信息编码。从神经节细胞和外侧膝状体的开-闭,闭-开感受器,到下一层的边缘觉察器,直条觉察器等,再到初级视皮层的超柱表征(形状方向),层级的进行表征了外在的信息。而联觉的存在我认为是在大脑皮层发生(我对Mattingley所提出的联觉产生于较晚阶段表示认同)。书中所讲,一些科学家认为嗅觉与记忆有很强的关联,原因在于嗅皮质与边缘皮质的物理上直接联系(因为海马损伤的病人识别气味有严重损害),但我有一个问题是,听觉与记忆的关系呢?我们是熟悉周围人说话的语音语调的,如若海马受损,这些会受到影响吗?
感觉与知觉,使我们与外界沟通的入口,信息汲取的方式。同时,它也深刻影响我们内在表征的方式。这也是现在机器人的一个大门槛(我在学校有家庭服务机器人项目),了解其内在机理有助未来。
四.识别
自己很喜欢识别这一章节,因为在大二自己做过人脸识别系统,所以很是想知道人识别物体,识别人脸的思路。当时自己的思路很是简单,数值图像要进行去噪处理,我选择gabor滤波,但是发现效果不好。转而利用sift算法进行人脸的相似点比较,业内认为这个比较好,我便将人脸的各个部分分块,分别进行比较,最后进行汇总,得出总的评分(有点集群细胞假说的味道),最终的效果还不错,就是还是受光照的一些影响。
但是在学习完这一章节后,我发现,识别远远没有现今人们想的那么简单。计算机的物体识别基本上是要学习整体三维信息,而人则不是(含推理成分)。人的优点体现在以下几方面:不受观看角度变化的影响,不受光照变化的影响,不受一定遮挡的影响。计算机明显是视角依赖原则,受角度变化影响,进而也会导致遮挡问题。而认知学的研究发现,我们既有视角依赖也存在视角不变的框架,难道这是为了提高鲁棒性吗?而提到鲁棒性,一种假说将最初的整体模板分割为小模板,如鬼蜮模型,这是基于“部件”的识别理论(比德曼),用于提高识别率。
在另一方面,计算机图像识别领域的一些人认为,如果采用3D,光照变化的影响可以排除掉。而我觉得这是一种逃避的方式。在自己做实验时,我便在2D图像上清楚的分辨出不同光照下的人脸,所以究竟是为什么能够做到这些,很值得搞清楚。
此外,我还对D.F.的那个实验(插凹槽实验)有很大的兴趣。起初,觉得这很不可思议,但是仔细想想后,如果按照书上所说是“什么——如何”通路的话是说得通的,文中也说,D.F.在记忆任务中的表现证明她方向的知识是好的,但是他此时大脑皮层中是颞叶还是顶叶后部激活,我觉得意义更为重大,记忆是否又是另一个起点,标志着识别的进一步进行呢?还是直接驱动动作进行呢?(因为我觉得“如何”通路是误差不断校正的结果,在记忆中也是可以*的进行误差校正的,如果想要验证,我觉得可以设计一个实验,让被试插入后再拔出,但拔出时要求最终和自己观察到的凹槽方向一致,来证明是否是校正导致的,尽管前面已经证明,但我觉得这更有说服力。)进而,我认为,更多的可以把“如何”或者“哪里”说成是一种整体上的匹配,要比物体识别的级别更高,是环境间的。可能我这么想有很大漏洞吧。
在识别方面,涉及的是匹配和匹配后的语义对应,从而可能产生统觉性和联络性失认症。而失读症与面孔失认症的区别是否印证了上文自己所描述的整体性区别,和局部性区别呢?我觉得在这里应该可以设计一个实验,但是我总是觉得自己把一些概念混淆了,不是很确定。
总的来说,我觉得物体识别给我的启示很多,但是理解的很不透彻,希望老师给我一些指导。
五.注意与意识
注意的存在我认为是因为处理信息“带宽”限制,必须把有限的处理能力大部分的分配给潜在的危险(进化论原因),并且注意也反过来影响我们如何分析感觉输入,编码长时记忆中的信息并进行语义加工。首先,我认为注意的第一个问题是为什么要注意,上面的文字可能回答了一部分问题,也因此导致在选择注意的机制上有意注意与反射性注意的分类。有意注意和反射性注意在竞争的基础上尽可能地满足了我们对于潜在危险的预知能力,进而提高了安全性。
在选择注意机制的机理上,提出过很多理论。从最开始的过滤器理论,衰减理论,到后来的后期选择理论,多样式理论等,每一次的理论的提出定是为了弥补前面理论的缺陷(因为实验发现的新现象)。我觉得,总的来说,注意是一个摘取的过程,在这个摘取的过程中我们得到些什么,丢掉些什么是应该首先寻找到的,在双耳分听任务中,我们听到了非注意耳中传达的自己姓名的声音,很明显这是我们得到的信息,但是为什么我们得到了这些而舍弃了非注意耳的其他信息呢?衰减理论应运而生,同时想法更为大胆的后期选择理论也提出了一些看法,但是很明显的是其他实验证据并不支持任何一方,最后的多样式理论似乎很合乎实验的结果,在表征构建阶段和表征进入意识的阶段都进行了选择。但是不同的思考思路往往能带来另一片天地,卡纳曼的注意和努力模型,以及尤里克*奈瑟的图式理论便是如此,从源头考虑的不同角度导致了整体概念的区别(实验证据的原因)。书中并没有说哪一种理论是正确的,也许都不正确。此时,我便有个疑问:在认知科学中,如果想证明一个理论的正确与否要根据什么,不可否认,肯定是实验,但是实验的证据往往是多方面的,或者说根据目前的实验证据,有可能所得出的理论是不唯一的,而实际上往往是这样(对吗?老师)。所以在这种情况下,只能是不断地根据科研人员的不断试验来验证吗?
第二个问题,我觉得是我们根据什么进行注意,或者说我们注意什么。书上提及了三个概念,空间,特征和客体。而视觉注意既能指向物体而不论其置于何处(特征注意?),也能指向空间位置而不知其置有何物(空间注意?)。我认为这是解释的通的,因为我们的有意注意是要我们根据什么来找什么(注意什么),根据空间位置寻找特征符合的,和根据符合特征的客体找位置是分别进行的。
第三个问题,我认为是注意的转移问题。认知神经科学也寻找到了与注意解除,移动,投入相关的大脑皮质,皮质下结构活动证据。而在整个注意章节的讲述中,最令我惊奇的是基于空间和基于客体的坐标系统,经典的划线实验也证明可他们的存在,并且在另一个回忆*广场的实验中也发现,忽视并不仅仅出现在外部感觉世界中,这是证明记忆视像提取过程中也走顶叶回路,而此回路也证明顶叶的作用。
总的来看,正像书中所讲的大脑状态的三成分模型,阈下加工,前意识加工和有意识加工。这是一种状态总结,很多注意的机理机制还是没有搞得明白,我觉得最主要的还是上面的三个问题,而注意的转移研究我觉得能带来更多的发现,因为这里可以做很多实验的涉及,进而向前面两个问题进行解释。
六.运动
因为自己在学校负责一个机器人项目,对这一点有一些了解。机器人的动作产生首先是上位机指令的产生与传达,下位机的接收与解析,进而进行动作的准备与进行,但同时为了考虑精确性,也会加入闭环控制(反馈,一般靠视觉反馈)。而在学习人类运动控制这一章节时,感触最多的是他的复杂性,与稳定鲁棒性。
首先是拮抗作用。α运动神经元的存在是信号翻译的基础,将神经信号转化为机械运动。α运动神经元接收的信息指令既有主动肌的兴奋,又有拮抗肌的抑制(此处不是很明白)。拮抗肌的存在是保证稳定性,或者说精确性。在另一方面,也可以看到机体的应激反应,如膝跳反射,这是不通过大脑皮质层次处理的(可以看做是上位机)。而且此处还包括一个反馈信息,因为α运动神经元也存在最低的水平输入信息,后进入背根(我认为以上都是很大的启示);其次是控制系统,大脑对于脊髓的控制,有直接控制的皮质脊髓束,也有间接地控制(终止于脑干,再走锥体外系),而辅助的小脑和基底神经节既调节锥外体系,也影响运动皮质。当然,控制系统也要接受反馈信息。
我认为,通过上面的描述,就可以看到现在大部分的机器人与人类在运动控制上的差距。明显地,Sherrington及其学生所做的猫狗实验,即使背根,甚至是高级指令的传输中断,依旧可以成功地实现行走动作。由此可以看到底层是上层既有一定的独立性又有一定的联系性,而且我认为一切就是为了稳定性服务(进化论的结果吧)。
涉及到的高层,即大脑皮层的信息处理。在基于位置编码和基于轨迹编码的问题上,我认为,基于轨迹是为了避障,基于位置是为了目标的精确性,重要性。它们在一定程度上是必须同时存在的(在上文所说的稳定性,进化论的基础上思考的)。当然,在此基础上,基于轨迹编码是要极大的受反馈信息影响的。
运动前区与联合区结合各类信息决定出动作指令,在小脑和基底神经节的帮助下,运动皮质和脑干结构将动作指令转化为运动,再传向给脊髓进行动作输出。但是,无论是基于轨迹还是基于目标,最后都是要产生运动,而运动的一个重要因素就是方向。书中所提的场向量概念就很好的解释了这个信息。而BMI脑机接口的实验我觉得是我学习认知科学最为振奋的(也许是因为现实的一种应用吧)。
而对于镜像神经元活动与基于目标的动作有关,而与得到该信息的途径无关。我认为是某些神经的双重身份,或者说同一神经元接受相似信息的过多(这也是神经基础),而镜像系统的分布式则更能说明这一点。
我认为,运动系统对于人类的进化作用很大,所受的影响也很大,所以应当多偏向进化的角度思考问题有可能有一些突破。
七.学习与记忆
记忆,我往往认为长时信息的存储,而想起计算机的记忆存储装置却是包含内外存的。外存类似长时存储,而内存则是短时工作记忆的一种比较(我认为当初提出应该也是因为内存的存在吧)。但是在最开始时,感觉记忆,短时记忆与长时记忆的区分往往是根据记忆信息的时长与注意的存在来做区分的。工作记忆的提出在另一方面与长时记忆是本质不同的,长时记忆似乎往往仅是存储信息,而工作记忆还涉及到子系统与长时记忆之间相互交流的命令控制中心。故而可能工作记忆的信息处理速度也在某种程度上限制了大脑的信息处理速度。我以为,纯粹意义上的记忆存储(长时)包括陈述性与非陈述性(内隐),以前把内隐局限在所谓的“肌肉记忆”(程序性记忆)上,但内隐记忆更明显的也存在于经典条件反射中。
对于记忆的过程,假设提出其涉及编码,存储与提取三阶段。记忆的内容可能包括图像,语音,抽象公式概念等,它们可能存储在部分或全部不同的记忆系统中。我最感兴趣的是海马在其中的作用,文中说,海马既能导致顺行性遗忘症,也能导致逆行性遗忘症。但也强调其对于快速巩固以及情节和语义记忆的初始存储非常必要,相悖的是海马损伤却仍可形成世界知识(语义记忆)和非陈述性知识。这些让我感到很矛盾。但是经过分析可知,海马是涉及到长时记忆编码与提取的。总的来看,逆行性会涉及到所存储位置与提取信息,顺行性会涉及到编码,存储,所存储位置以及提取。那么海马的损伤到底中断了那个环节呢?科学家提出了存储位置不同,海马损伤语义记忆的成功说明它的四个阶段并未受到影响,或者它走了另外的一条支路,而情节记忆就不是了(故而我认为应当仔细研究情节与语义通路的区别)。另一方面我认为大多数科学家以为长时记忆存储于新皮质,那么逆行性的不成功是否是因为提取信息的失败呢(况且上文也提到海马在提取中的作用?我还有个问题,此类病症的过少病人数量是否会包含一些特异性?
在海马对虚假记忆表现和真实记忆表现出同样的高激活反应方面,我以为,根据经济型原则,人们往往会选择花费较小但可以获得“可靠信息”的方法,某些世界性语义知识虽然和事实不相符合,但是它的提取是花费小的,且含有一定的真实性(甚至其中包含一定的符合事实的推理),故而最终导致了虚假记忆的成功,真实记忆提取的失败。
而本章更让我看到了功能基于结构的原则。长时程效应正是记忆的细胞基础,而记忆的消退,干扰,混杂等现象也就不是很难解释了(但还要涉及大范围知识)。所以,有时真的想去拿大脑的某一部位取类比计算机的某一部位,也许这种方向便是错误,很多分布式的结构,仅仅是一些概念上的趋同,况且计算机是我们根据对自然的理解,利用一定的知识制造的,而人是自然“制造”的,应当是有很大的不同吧。记忆理论就为我们打开了这扇窗,但是以后思考的方向是什么?我觉得还需要探索。
八.情绪
书上本章主要讲的是杏仁核及其与对应的恐惧情绪。杏仁核是在大脑皮质,尤其是前额皮质进化之前,故而“感性”层面多而“理性”层面少。在学习中,最使我感到进化论神奇的是US和CS信息可以同时经由两条独立路径到达杏仁核,包括低通路和高通路。不经过感觉皮质的粗略匹配和经过感觉皮质处理的详细分析结果共同提供应激性,安全性和准确性(同样的例子还在皮肤疼痛感受器)。这体现人体认知系统极高的鲁棒性。
在另一方面,书中也将杏仁核和海马联系在一起。外显记忆于情绪有很大影响(如回忆起某事会有一定的情绪感受伴随发生)。同时情绪也对海马记忆系统有很大的影响,如唤醒状态下记忆能力的极大提升。故而作用是相互的。
而我一直有个问题,我认为情绪的发生应该是先天就有的,为何苦笑会不同?它们所产生的效果又会有什么作用?我觉得,我们的情绪发生正是所想象的那样,是要有背景或者可以说是“气氛”的,而气氛的产生是依据大脑所处理得到的综合信息,这就需要各个脑区相互作用来促进情绪的检测和体验的,而事实正是这样!
九.语言
语言分为语音形式,文本形式以及动作形式。书中主要介绍了语音与文本形式,通过言语加工的整个层次模型,从对语音,文本知觉分析,到其输出结果激活了心理词典中的词形表征,再到词汇选择以及词汇整合,当然之后还有单词组成句子,句子组成语篇的过程。基本概念:心理词典,其中涉及的语义,句法,词形等信息,甚至包含词元信息。我认为,它就类似rom(只读存储,当然在一定程度上也是存在学习存储因素),并且可能是由其语义特征或语义属性表征的。在Willem Levelt语音产生模型中,首先是宏观概念准备阶段,紧接着是微观概念,会去激活其在心理词典中的表征,选择词元,激活词素或词形。我们经常描述的一种状态“心口不一”,也就是想说一个词,但说出来的却是另外一个词,是不是就是词元向词素转化过程中产生的?或者本身就没有词元呢(本身就仅有一个词)?
在语言的另一方面,我觉得更为重要。也就是心理词典部分,我们听到花香似乎就能闻到花香,看到藏獒二字就会毛骨悚然(当然是一部分人),不同的信息是否根据其特性被记忆在不同的大脑位置上,记忆的很大部分是其带给我们的第一或者首要感受。就如文中所说的,人造物偏向功能,生命偏向于知觉。故而心理词典可能是分门类的。这一点也有利于信息的收集与整理。
在另一书中,作者反复强调思维与语言之间的关系。是谁依赖于谁,还是相互独立?我想过这样一个问题,既然某些思维活动(如推理),它所借助的平台可以不是语言,可以使图像(如汉诺塔游戏),那也是一种思维的体现,故而我认为现有思维后又语言,或者可以说,在没有产生语言的时候,我们知道如何去狩猎,这也是一种思维的体现吧。语言反而是我们自我搭建的另外一个有利于信息交流,思维表现的新平台。它当然会体现思维的某些方面,并且有可能反过来影响思维的某些功能(我觉得,任何东西用久了,就会产生习惯性思维,类似于内隐记忆,或者就是内隐记忆)。
总之,我以为,语言是我们利用人类自身的智慧创造的一门利器,于信息交流,于思维速度等。但更重要的是,从进化论角度考虑,这是为了避险,为了生存的必要(但这是一种软性进化)。
十.总结
暑假这段时间学习认知科学,精髓不可能说抓住,只是明白我在看一门要干什么的学科。在学习的过程中我发现一些问题和感悟,总结如下(我认为,基本上可以从进化论的角度来思考这些)。首先,大脑为了系统鲁棒性,存在很多两套系统(有一定重叠性),有轻有缓,有快有慢;其次是交叉信息传递的实际意义;以及分布式存储与工作的意义与目的;最后是拮抗的产因,或者说进化原因。同时我也有一些想法,但仅是雏形,首先是新的实验方法(我想在仔细学习完心理学实验后再详细写出,其中主要原因是特异病人数量过少);其次是一种数学逻辑的证明,现在大多数的假设是通过某些实验的证据猜测的,证据一变化就可能会产生假设的错误,我觉得到现在是不是应该总结一下,用数学的方法约束一些假设(尤其是在神经细胞上找根本性原因),寻找一些根本(数学是自然的,生命也是自然的,我觉得有重叠的部分)。也许是我异想天开吧,但是我总觉得科学是整体的,密不可分,相互联系的。
总的来说,我很庆幸今生能够遇到这样一门学科,帮助我了解自己,未来及过去,甚至是现在。
“认识自己,知觉自然”。