发了疯地学习(下篇)——底层探究,激发学习的元动力
http://m.yanjunaudio.com2021年05月28日 13:50教育装备网
强化学习,反馈回路与反馈强化就是构成人工智能理论中强化学习的基础机制,强化是指在不断尝试中,个体所学习到的反馈回路,不断更新,并最终优化到可能目标的过程,它和监督式机器学习一样,是构成人工智能的基石,从生物学的角度讲,强化学习更符合人类的进化方式,从古代的尼安德特人开始,不符合正反馈回路的行为或族群就注定被环境所更新,也意味着淘汰,人类之所以进化成人类,是因为除了总结旧有知识并发现规律外,还会不断尝试和探索。深度了解强化学习的机制我们就能发现“学习”这个动作的本质。

学习,究竟是为了什么?不打游戏是为了更好的学习,更好的学习是为了更好的生活,那什么又是更好的生活呢?可以痛快的玩游戏,算不算更好的生活呢。我们从小被教导要好好学习,却从来没有真正思考过,为什么要好好学习,如果连成因机制都不了解,看再多的思维教学和学习导论,也没有办法让自己高效的执行学习这件事,我们真的厌恶学习吗?
其实,站在人工智能的角度看,学习和玩游戏没有本质的区别,学习是一个枯燥的过程,你要背单词,记公式,还要练习,玩游戏也是如此,你要记忆每个角色的技能,走位技巧,出装顺序,也要通过很多的对局来练习。在强化学习系统中,他们都是一种东西,即“动作”。动作本身无所谓枯燥和有趣,关键看它所处的状态和预期的奖励。人类厌恶枯燥的东西,所以当学习索然无味时,我们就会讨厌学习,这是天性,学习并不能带来和游戏一样的快感,否则的话,没有人会讨厌学习,但是,也有人却坚持学习并乐在其中,为什么?答案就是反馈机制,当学习的动作带给人的收益为正,就会带给我们所说的快感预期,也即前文所题的多巴胺,如果只靠意志力去学习,就像不断绷紧一根弦,强行违背生理的感觉,到最后早晚会断掉。

我们绝大多数人,没有移山填海的毅力,因此这样的学习是不科学的,大脑发出指令的动机其实和海洋馆里的海豹一样,是为了眼前那条小鱼干,顶一次球给一条鱼,只有不断收到正向的反馈,才会自然而然地保持前进的动力。高清楚了这点,我们就可以思考,如何让自己像打游戏一样沉迷于学习。
我们该怎么做?学霸和学渣的区别,就在于对快感预期的不同,预期不同形成的反馈也不同。学霸,可以看作一个高效的强化学习系统,它具备完整的反馈回路以及有效的反馈强化。具体到操作中,成为学霸,以下三点是基础。
缩短反馈周期。反馈周期长意味着半衰期长。那半衰期是什么,以后的文章我会讲,这里只需要知道,反馈周期太长,是大多数人无法坚持的主要原因。举个例子,有的人高中学习成绩很好,可是到了大学就一落千丈,有人说是因为高考之后人松懈了,容易变笨犯懒。很可惜,这个说法并没有研究结论支撑,真正的原因是反馈周期的拉长。在高中时,一个月会有三四次测试,努力学习一个周,就能看到努力的效果,班级名次很容易进步,接着,同学吃惊,家长表扬,老师夸赞,你会觉得很开心,打了鸡血一样继续学习,这种感觉可能会持续几天,还没等它消退,下一次考试又来了,在这样的反馈回路中动作带来的奖励被极大加速,整个系统变得完全正向。而上了大学以后,认真学习一个学期才能有一个号的GPA,这个反馈周期变长了好几倍,而且也很少有人再收到过度的夸奖和极大表扬。因此,大多数人坚持不下来,取而代之的很多人习惯,考试前一周开始执行学习的动作,因为只需要一周就可以获得奖励,比如及格。所以,要想办法减少你的反馈周期。其他做法,将大目标分解成小目标,会更容易塑造一个连续的回路。
增加反馈强化。前面我们提到过三种反馈模式,固定比率强化,固定时距强化,不固定比率强化,那么把游戏替换成学习,我们需要做什么?可以是考试累积进步10名,就请自己吃烧烤;也可以是隔壁班的小爱刮目相看的SSR;又或是再看三小时书就去打游戏。对应到相应的收益上来,就是提高学习留存率;延长学习时间;增加学习收益。
调整反馈难度,有研究表明,游戏玩家在大多高难度关卡挑战成功后,大脑多巴胺回路会异常激活,也就是说,适当的高难度游戏,能够最大化的激化反馈回路,这也是很多游戏中设置排位赛机制的由来,通过匹配不同难度的对手,既不会让你一直输下去,也不会让你永远赢。而是塑造一种升段掉段的奖励机制,让你的反馈回路一直处于半激活状态。在学习中,如何设置难度,需要根据个人情况制定,下一次考试提高10分,或成为班级第一,就是两种不同的难度,既不要太简单也不要太难。

一旦大脑完成了一次正反馈回路,那么久尝试过一次甜头,你的动力就会越来越足,甚至会享受学习这件事本身像打游戏一样,疯狂的学习,这,就是学霸的诞生规则。关于反馈机制,还有很多东西可以讲,具体的学习方法也远不止这些。那MR智慧教育,就是在探究学习动机和反馈的根源后,高效地辅助教学,引导反馈回路的正向,通过形象生动性增加反馈强化,大数据的指导下,也针对性的调整反馈难度。奥图码MR智慧教育,用底层思维逻辑,运用5G/VR/AR/MR/AI等技术手段,激发学习元动力。
更多精彩,敬请期待。
奥图码数码科技(上海)有限公司致力于智慧教育驱动力协作发展,欢迎合作垂询。
注:本文为企业发布的推广文案,不代表本站观点。
责任编辑:董晓娟
本文链接:TOP↑