《电子科技》
致力于研究智能信息处理,杭州电子科技大学教授颜成钢——
科研下苦功 算法更聪明(科技自立自强·青年科学家)
核心阅读
今年37岁的杭州电子科技大学教授颜成钢,专注于智能信息处理研究。由他设计的算法能检测出网络中的不良视频信息,获得大规模应用。他常说,科研为国分忧,创新与民造福。他鼓励学生按照自己的规划、兴趣选择科研方向,做出更多解决实际问题、与大众生活紧密相关的研究。
杭州电子科技大学的智能信息处理实验室里,伴随着键盘敲击声,一串串代码跳动在电脑屏幕上。
正在编写代码的是杭州电子科技大学自动化学院教授、博士生导师颜成钢。颜成钢今年37岁,已担任智能信息处理实验室主任。2008年起,颜成钢作为第二完成人参与了“互联网视频流的高通量计算理论与方法”项目,由他设计的算法能检测出网络中的不良视频信息,有效应对复杂视频场景,该成果如今已获得大规模应用。
升级算法,识别网络视频和图像信息
“现在每天有海量用户向平台上传数据,绝大多数都是图片、视频数据,其中可能会包含一些低俗内容。”颜成钢说,这一现象引起了他和团队的关注。
颜成钢说,传统的过滤算法主要针对单一模态内容中的某些固定特征展开,在媒体形态较为单一时能起到一定效果,但难以满足当下的实际需求。那么,如何创新算法完成复杂的信息筛选?
“我们首先尝试让算法能够笼统理解整个多模态内容的大意,给出定性的判断。”颜成钢介绍,但实际应用场景十分复杂,简单给出判断难以满足实际应用需求,因此团队进一步尝试让算法能识别多模态内容中的各种细节,再将细节串联,实现对多模态内容描述性的理解。
借助跨模态检索技术,团队将图片、视频数据转化为特定文字,并在此基础上,构建出语料检索库进行二次关联与推理,以此获得更为准确的语义信息。
“当内容复杂难以直接给出详细、全面描述时,就可以通过检索方式,在数据库中查找最接近的内容,从而间接地实现理解。这样一来,只要我们的数据库做得足够好、足够大,就能解决这一问题。”他补充道,“打个比方,输入一个汉字‘马',内容理解是要求画出一匹马,而检索只要求找到一匹马,后者明显更简单省时。”聚焦图像、文本等单一模态信息处理方法,颜成钢团队在内容显著性检测、复杂文字识别、目标检测、目标检索等方面取得众多突破。
创新攻关,科研解决实际问题
“长江学者奖励计划”特聘教授、“长江学者奖励计划”青年学者、中国电子学会优秀科技工作者、浙江省杰出青年基金获得者……颜成钢获得的荣誉不少,但他更喜欢称自己为“信息筛选员”。在他看来,团队成员的目标就是筛除不良信息,清朗网络空间。
采访中,颜成钢一直把“科研为国分忧,创新与民造福”挂在嘴边。“做科研要顶天立地,科研人要有担当精神。一方面要真正为国家解决实际问题。另一方面更要服务于民。”颜成钢说。
颜成钢团队先后获得中国电子学会科学技术奖自然科学一等奖、国家自然科学奖二等奖、吴文俊人工智能科学技术进步奖一等奖……研究成果高产的背后,离不开他的自律与勤奋。
2019年,颜成钢在北京跟进一个重要项目,恰巧团队负责的另一项国家重点项目进入关键阶段,两个项目怎么兼顾?颜成钢回忆:“白天我专心在北京做项目,晚上9点后的时间属于团队项目,尽可能把成员白天提出的问题一一解决并论证。”颜成钢说,每到周日,他还会一早乘飞机赶回杭州,与团队成员一起讨论研究,当天晚上再飞回北京,“那段时间简直太忙了。时间不等人,机会更不等人。不能因为我而拖延研究进度,宁可自己少睡点,也要让项目进展再快些。”
言传身教,支持学生探索感兴趣的领域
2021年夏天,一条“利用步态算法优化身份识别助刑侦破案”的消息引发关注,该算法可在找寻丢失儿童等领域发挥积极作用。
“这是我指导的博士生的科研成果,论文发表在一个国际学术会议上,还获得最佳论文提名奖。”颜成钢言语间满是自豪。学生的学术成果有了实际应用,让他很开心:“能将学术研究与大众生活结合起来,感觉很有意义。”
颜成钢的实验室研究范围包括图像处理、计算机视觉、计算机图形学、医学影像处理、生物信息处理等诸多方面,“实验室的研究领域比较广阔,也是为了给学生提供更大发挥空间,只要学生感兴趣、有潜力的领域,我都支持他们去探索。”颜成钢说,应该鼓励学生按照自己的规划、兴趣,选择科研方向和工作去向。