奖惩中枢、奖惩系统的一些说明

17 提交 / 0个新回复
最新回复
奖惩中枢、奖惩系统的一些说明

一、只要我们承认人的任何思想、行为及大脑的功能都是由相应的中枢(神经通路)控制,那么我们根据人思想、行为的特点所确定(定义)的中枢或神经通路及它们的功能便是真实存在而不是假设的。
二、奖惩中枢及神经兴奋习惯具有广泛的作用与意.
奖惩中枢、神经兴奋习惯与心理学、人工智能、道德、文化、脑的高级功能等的关系。
成人语言、媒体、道德、文化对小孩的影响与奖惩系统
理想状态下,对一个小孩来说,如果按成人的命令去做,大多数情况下会获得奖赏,而不按成人所说的去做大多数情况下会获得惩罚,从而使执行成人命令更多的与奖赏中枢建立了记忆联系(包括与奖赏预期中枢),而不执行命令则更多的与惩罚中枢建立了记忆联系。
在成人命令、执行与不执行分别与奖惩中枢建立了一定的记忆联系后:
1、成人命令对小孩的刺激所对应的神经通路(用A表示),通过“执行命令”所对应的神经通路兴奋奖赏预期中枢,A与不执行所对应的神经通路兴奋惩罚预期中枢,从而使奖惩预期中枢易化执行所对应神经通路,而抑制不执行所对应神经通路,从而使命令得以执行。
2、重复执行命令多次后,A便会习惯性兴奋执行所对应的神经通路,而使成人命令得到执行。
3、当成人命令与另一可带来奖赏的行为相冲突时(如饮食),那么这一行为对应的奖惩预期中枢便会抑制执行成人命令所对应的神经通路,而易化不执行成人命令所对应的神经通路,如果不执行占优势,小孩便会不执行成人的命令,而如果执行占优势,小孩便会执行成人的命令。
4、这便是成人命令对小孩影响能力的学习过程(理想的奖惩学习),当然现实生活中不会有这样理想的过程,但基本机理相似。
成人语言对小孩的影响,以及书本知识、媒体、规章制度对小孩的影响形成的基本机理与之相似(当然它们对小孩的影响还应设计到小孩的认识对思想行为的影响,不过认识对思想行为的影响也是奖惩学习的结果),且它们影响的基础仍是奖惩中枢,它们一方面通过奖惩中枢直接影响思想行为,另一方面通过各种奖惩预期来影响思想行为。
奖惩中枢、先天奖惩刺激、与奖惩中枢存在一定强度记忆联系的神经通路共同组成的系统我们称为奖惩系统,它的发展状态通过各种对行为产生影响的刺激或认识反应出来,这些刺激和认识包括对错、好坏判断,成人语言,书本知识、媒体等。
研究奖惩系统的发展变化规律意义重大。
心理学的潜意识(可认为是早期的奖惩体验带来的奖惩联系的习惯化的结果)、自我、本我、特质(遗传限制下,奖惩中枢影响下选择形成的神经兴奋习惯的集合)等都能用奖惩系统学习理论结合神经兴奋习惯形成的原理容易的解释。
通过上面的讨论可知如果要弄清道德、文化、规章制度如何对人产生影响及影响是如何形成的,同时弄清如何让人通过学习形成对它们适当的反应,就必须研究奖惩系统的发展变化规律。
奖惩系统与人工智能
有了以上的研究基础之后,我们在编写智能软件时就能借鉴以上的研究。
1、为智能软件控制的智能机器人设置初始且合理的奖惩系统,让它在环境影响下自我学习发展。
2、设置适当的智能软件学习环境、道德、文化、规章制度使智能软件的奖惩系统的发展在人的可控制下,从而使形成的智能软件后天的奖惩系统,对人有利。
奖惩系统与脑的高级功能
小孩(或智能软件控制的智能机器人)一产生是不会具有象成人一样的注意、思维、想像、意识、推理能力及意志特点(意志可认为是多个奖惩预期不断相互作用的表现)的。在人实践的过程中,正确的注意、思维、想像、意识、推理及适当的意志特点一般能带来正确的结果,也就是说能带来奖赏,会被奖赏中枢强化。错误的注意、思维等会带来不正确的结果,在实践中带来惩罚,会被惩罚中枢弱化。通过长期的奖惩实践后,人会形成与环境相适应的注意习惯、思维习惯、想像习惯(什么时候想像,如何想像)、推理习惯、意识习惯(如何注意感知,如何回忆、认识、判断)及意志特点,因而成人大脑的高级功能是在奖惩中枢的参与下形成的。
小结
综上所述可知:奖惩中枢、神经兴奋习惯对心理学、智能机器人、情感、道德、文化等众多领域的问题的解决都有重要的帮助,它们应是这些领域基础性的问题之一。我认为,之所以它们没有引起人们的关注,正是因为它们的广泛作用,而使人们习以为常的结果。
未来对以奖惩中枢为核心的奖惩系统的研究必将成为学术界研究的热点。
 
进一步的论述可看下面的链接的一些blog:
http://www.roboticfan.com/blog/user_2005/2171/index.shtml