对普通大众而言,数据科学像一位熟悉的陌生人。“大数据”三字常见诸于各大传媒端,是诸多领域的热词。大众的瞩目让数据科学的光环愈发耀眼,而处在数据科学“光环”底下的人———就读于这一专业的学生们,他们又有着怎样的感悟和思考呢?
初叩数据科学的大门2017年9月,刚进入物理与材料科学学院学习的梅文娟不会想到,大学的第一门公共选修课“商业分析”会为她打开另一个世界———大数据分析的大门。梅文娟回忆,授课老师对大数据技术的赞赏让她感到好奇,于是她特意关注了相关信息。同年,在“数据挖掘”专业课上,来自计算机科学与软件工程学院的朱国桢对老师提及的“用户画像”表现出了浓厚的兴趣,“我觉得使用数据去分析人很有意思,自己也想学习这些知识。”
“我在数据科学与大数据专业转专业考核开始前一个月的时候,才下定决心要转过去。”梅文娟说,慎重考虑后的选择是不会轻易改变的。当时她暗自思忖,如果今年不行,那就明年再战。“我觉得这个专业的就业方向和发展前景都很好,我相信自己能够通过它接触到更大更广的世界。”2017年4月,转专业考核结束后,她的朋友圈有了不同以往的内容,她会调侃自己花三个小时debug后,发现并不存在bug,也会开心地宣布“终于结束了csapp(“深入理解计算机系统”课程)最后一个lab!”
和梅文娟一样,朱国桢在选择保研方向时,同样迟疑过。一番犹豫不决后,他最终敲定了自己的研究方向———数据挖掘里的社交网络分析。朱国桢坦言,当时觉得计算机很难,也考虑过人机交互的用户体验这种交叉性强的专业。后来,他还是选择了数据挖掘方向。“学了开发,就可以深入了解计算机行业。就算发现自己不适合做技术,也可以转产品。”
随着数据科学研究的深入,千千万万的人被数据科学所吸引,他们也只是其中的两名学习者,试探性地叩开这一学科的大门,开始走进不一样的世界。
转入新专业,跨出第一步新专业的学习从当年的暑假就开始了,当其他同学开始享受假期,或是投入各类社会实践拓展视野时,新转入数据学院的同学却必须通过两周的C语言学习与考核,才能开始假期生活。数据科学与工程学院院长钱卫宁说,“我们会在7月份的短学期把同学们‘关’上两周,上午通过网课视频学习理论知识,下午进行上机实践。”如果没有通过考核的同学,还需要再学习一周。钱卫宁坦言,这一过程中,不论男生还是女生,都有人掉眼泪。
梅文娟回忆起当时的情景时,亦颇为感慨。两轮考试后,和自己一同学习的同学渐渐通过了考核。随着同伴的一一离开,她开始怀疑自己的能力。尽管如此,她还是努力地坚持了下来,并且乐观地认为,自己得到了很好的锻炼。“一个月,仅仅一个月的时间,我就学会了C语言!之前,我会认为这几乎是不可能的事,但是我竟然做到了。我发现,通过努力,很多以前我们不敢想的事情,原来都是可以实现的。”接下来的一年里,为了适应新专业对实践能力的高要求,她一直试着转变学习模式。“我们以前只需要做题,但是现在什么事情都需要自己动手去做。”
钱卫宁也表示,刚转进来时,很多同学在学习过程中会遇到不少问题。尽管老师们在面试时会和学生阐明专业的性质,仍然会有部分同学在接触专业内容后发现,其实自己并不喜欢这个新专业。“面试时我会跟大家讲,你们这是上了‘贼船’,而‘下船’不是那么容易的事情。除非你喜欢和计算机打交道。”除此之外,同学们还需要逐渐适应新的学习模式。专业的性质对学习者提出了更高的要求,除了掌握分析和解决问题的能力之外,学习者们还需要发现问题和定义问题。“现今的基础教育,包括一部分大学教育,在这些能力上的训练是不够的。”
专业学习带来新视角数据正在逐渐深入人们的日常生活。很多人都听说过,甚至能说出几个数据科学领域的子话题,比如数据可视化、机器学习、数据挖掘等等。对此,钱院长表示:“大数据特别‘热’,但是大家对大数据的理解都不一样。大数据不是一个标签,数据是有价值的。”例如数据与用户画像的结合,能够对购物兴趣做出精准的推荐;通过数据的运作,省下的劳动力能够被用于其他领域的研究。
“深入理解计算机系统”课程是梅文娟喜欢的一门课,钱卫宁会在课堂上分享很多与计算机相关的小故事。“同学对我说,学了之后去看《三体》,会更有趣。比如其中的人列计算机,硬件是三千万个人,白旗为0,黑旗为1。实际上这是运用了冯·诺伊曼体系和计算机中的很多知识。当发现自己学的东西被《三体》的作者以另外一种形式写出来,就会觉得惊喜和有趣。”专业与生活的密切联系,带给她一种实实在在的、看得见摸得着的感觉。
“学习这个专业后,我的思考方式有所改变。”现在,不论是学习还是日常生活,面对问题时,梅文娟始终相信,只要专注耐心,很多问题并没有想象中那么困难。她思考问题的方式也从单纯地探求原理转变为积极地寻找改善方法。“以前我是理论学习,学完了想着如何应用;现在是以目的驱动为主,需要什么就学什么。”
朱国桢同样欣赏数据与其他行业结合所带来的更大的价值。“比如杭州在做的‘城市大脑’,就是用大数据分析路况信息,调整道路情况,减少堵车风险。”他笑着说,“希望自己深入学习后,也能给社会带来价值。”
数据科学与工程学院还有很多和梅文娟一样的同学,正在接受学科专业训练。学院秉承的“创新驱动,问题导向”理念塑造着他们的专业视野,同时也影响了他们思考问题,看待生活的角度。也有像朱国桢一样的研究生,看到数据科学正在让生活更美好,并热切地希望自己所学对社会有所贡献。
正如钱院长将数据比作发动机那样,“需要有人去制造这样的发动机,这就需要我们培养专业人才去完成。”和其他任何学科一样,基础探索是最不容易、却最重要的一个环节,专业的人才培养是探索的第一步。我们有理由相信,“光环”下潜心探索的人,会在将来成为承接“光环”的人。(陈茉菡)