第113章 李晓军和方麟(2/2)

天才一秒记住本站地址:[笔趣阁ok]
https://www.bqgok.net最快更新!无广告!

年轻人头脑灵活,更容易想出超出常理的研究方向和研究设备出来。

而且,第一位王栋的宠儿,那个“太空粒子对撞机”的申请者,已经用他悲催的经历给大家做了很好的示范,太在乎地球上的尊卑关系,脸皮不够厚,最后倒霉的只能是自己。

不得不承认,王栋的这一举措,又把地球上讲人脉、讲资历的学术圈子冲击了个七零八落。

李晓军后知后觉,此时才意识到问题所在,一时之间也面沉似水。

大家在沉重的气氛中僵持了半天,终于有人开口说话了,“我们弄个连续学习方面的本子吧。”

说话的人叫方麟,是一位平时很让李晓军头疼的学生。

倒不是说方麟是个很笨的学生,他才华横溢,聪明得紧,应该是李晓明带过的学生中最聪明的一个。

但就是太有个性,自己想研究什么就研究什么,不怎么听指挥。

李晓军不止一次想劝退这个学生,或转到别的老师名下。

不能给老师干活的博士生当然不是好博士生。

李晓军迟疑道:“这算是通用人工智能的范畴了,有点太超前了吧?”

方麟瘦瘦高高,顶着一脑袋的长头发,虽然还没长到尽显艺术家的风范,但也足以像鸡窝一样乱糟糟的。

方麟:“王栋不就是想要超前的东西么,越超前越好。”

余下的同学都点头赞同,表示深以为然。

李晓军也觉得有理:“大家现在都在做自监督预训练,有大模型大算力加持,出现了智能涌现。”

“这几年连续学习相关的研究工作的确进展缓慢,好像没有什么清晰的方向,不好做啊。”

“不过,好做的都被申请完了,做连续学习也不错,但咱们得弄出一个具有可行性的解决方案来。”

方麟:“连续学习面对的主要问题是灾难性遗忘。如果让深度神经网分多次学习,学了后面的知识,就把前面的知识忘掉了,或者说覆盖掉了。”

“所以,这是个如何在深度模型中保留记忆的问题。”

“已有方法大概采用了如下三种技术路线:”

“一是保留以前学过的部分代表性样本作为记忆,这些样本要参与到后面的模型训练,从而把记忆转化为模型参数;”

“二是在模型学习新知识时限制参数在一个限定的范围内变化,而这个范围是由旧知识决定的,所以就达到了不会遗忘它们的效果;”