访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事


访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事
文章插图
@黄萱菁
复旦大学自然语言处理实验室
1993年于复旦大学获计算机理学学士学位
1998于复旦大学获计算机博士学位
2006至今 复旦大学信息科学与工程学院教授、博士生导师
访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事
文章插图
以下为访谈实录:
未来媒体访谈:我们本期未来媒体访谈非常荣幸邀请到了复旦大学计算机科学技术学院的黄萱菁教授做客本期节目。
黄萱菁:大家好,很高兴参加这次的未来媒体访谈和大家分享我对媒体、对人工智能、对自然语言处理的一些看法。
“我为什么选人工智能呢?主要就是因为它困难,读研究生嘛,要做有挑战性的工作。”
未来媒体访谈:回到您学术生活最开始的时候,当时为什么选择了自然语言处理这个研究方向?
黄萱菁:我大概是1993年开始读研究生的,在我读研究生的时候,人工智能的规划、计算机视觉、机器人其实都是一样的困难,我为什么选人工智能呢?主要就是因为它困难,读研究生嘛,要做有挑战性的工作。
未来媒体访谈:自然语言处理还是属于认知智能这一块领域,相比于感知智能,比如计算机视觉,您的选择是更偏认知智能这一块?
黄萱菁:我都做过,我读研究生的第一年我做的是计算机视觉,后来第二年就开始做自然语言处理,因为我自己导师吴立德老师两个都做,他一手做视觉,一手做自然语言。但另外比如像机器人我就没有做,因为机器人其实有很多硬件,不仅仅是软件的问题,我们做的是纯软(件)。
未来媒体访谈:您近些年把研究方向逐渐转向NLP基础技术,这是出于什么样的考量呢?
黄萱菁:其实我在自然语言处理里也换过很多个方向,比如像我早期做过自动文摘,后面做话题分析,现在还在做,比如像社会媒体的信息处理、情感分析,现在做自然语言基础。其实主要是因为,一方面,作为研究人员来说,总是喜欢变的,不可能几十年不变做一件事情,当然这样的人也有,对吧?比如像Hinton,在所有人都不做神经网络的时候,他会几十年如一日做,做出很好的成果,但是对我们一般水平的研究人员来说,还是做几年要换一个题目的,这样才会有新鲜感。
我过去比较偏应用,就会发现应用的话,你刚开始做某一个领域,比如像做情感分析,会有很多进展,然后慢慢的就会到一个瓶颈期,那么这个时候就会想我是不是前面基础的工作的话做得不够好,使得后面任务性能不能进一步提高了,所以就会想着回来去做比如像基础处理,这个是一方面。
另外的话,现在的基础处理非常的重要,因为这相当于是修高速公路这些基础设施,如果现在自然语言处理的基础设施,像预训练模型,这些基础处理做得足够好的话,会给下游任务带来很多性能提升。
未来媒体访谈:FudanNLP这个开源工具包是不是也主要做基础这一块的性能提升的?
黄萱菁:是的,FudanNLP的话主要是我的同事邱锡鹏带着我们一些研究生在做,它早期采用机器学习的方法做基础的自然语言处理,比如分词、词性标注、句法分析、实体提取,我们最近基本上不太开发了,现在开发的下一版叫FastNLP,是主要采用深度学习的方法来做的自然语言处理基础工具。
访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事
文章插图
FudanNLP 不再更新 图源:https://github.com/FudanNLP/fnlp
未来媒体访谈:您32年的学术经历(从本科到现在)大致经历了人工智能从冷到热这样一个热度的转变,您对热度的转变有一个非常明确的感知吗?

推荐阅读