第656章 专访(上) (第2/2页)
“有一天我爸下班回家,他在饭桌上跟我聊起了ImageNet比赛。他说现在的计算机视觉正在经历一场变革,让我有兴趣可以去了解一下。”
苏晚晴适时地引导。
“所以是爸爸的鼓励让你迈出了第一步?”
顾超凡点头。
“对。我爸是搞底层架构开发的,他经常跟我念叨一些技术名词。他在指导和点拨我的时候,给我推荐了盛夏科技开源的TenSOrFlOW框架。”
“他说这个东西能让我少走很多弯路。”
苏晚晴看着提纲上的问题。
“很多研究人员都觉得深度学习的门槛非常高,需要极强的数学功底和复杂的算法设计能力。你作为一个高中生,在面对这些庞杂的知识时,觉得困难吗?”
顾超凡放松了许多,谈到技术,他的话匣子被打开了。
“如果是以前,那肯定难如登天。我连大学的微积分和线性代数都没学过,怎么可能去手写那些复杂的反向传播算法和矩阵运算代码?”
他用手比划了一个方块的形状。
“但是我用了TenSOrFlOW之后,发现事情完全变了。这感觉就像是在搭乐高积木。”
苏晚晴挑起眉毛,表现出很感兴趣的样子。
“搭乐高?这个说法很有意思,能具体解释一下吗?”
顾超凡坐直了身子。
“你看,乐高玩具的每一个模块,不管它是长条的、方形的还是圆形的,它的接口都是标准化的。我不需要知道这个塑料是怎么倒模出来的,我也不需要知道它的材料成分是什么。我只需要知道,我把这个模块插到那个模块上,它就能拼出一面墙,或者一辆车。”
顾超凡越说越兴奋。
“TenSOrFlOW给我的感觉就是一盒超级强大的数字乐高。它把那些最复杂、最难懂的底层数学运算全都打包封装好了。我只需要调用它的API接口。”
他用双手在空中模拟着连接的动作。
“我要加一个卷积层,啪,调用一个模块;我要加一个池化层,啪,再加一个模块。这帮我屏蔽了所有的底层复杂性。”
“而且每一个模块应该怎么样使用,在什么样的情况下使用,官方的文档里面,都给了比较详细的示例代码和教程。”
苏晚晴看着他专注的表情,继续发问。
“也就是说,你并不需要理解每一行底层代码的逻辑,也能完成顶尖模型的训练?”
顾超凡非常坦诚地点头。
“是的。外网那些大牛管这个叫深度学习前沿研究。我倒感觉这种操作像是‘炼丹’。”
苏晚晴笑了出声。
“炼丹?为什么这么叫?”
顾超凡也跟着笑了起来。
“因为很多时候,我也不完全确定为什么加了这一层,准确率就会提升。”
“我就是在框架里不断地调整参数。”
“改一改学习率,调一调批次大小,然后把数据喂进去跑。”
“就像古代道士把药材扔进炼丹炉里,看看最后能炼出个什么东西来。”
他收起笑容,语气变得认真。
“但是,能够让我这样不断试错、不断‘炼丹’的前提,是这个丹炉必须足够好用。”
“TenSOrFlOW帮我处理了显存分配、跨硬件调用这些最麻烦的事情。如果让我自己去写CUDA代码来调度GPU,我估计写三年都写不出一个能跑的DemO。”