访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事( 三 )


未来媒体访谈:AI+传媒或者是NLP+传媒这一块的应用场景是怎么样的?我们知道近些年随着深度学习的发展, NLP领域其实有一个又一个的技术突破,您觉得可能哪个技术突破对于媒体领域来说会开一些新的脑洞或者说有比较重要的意义?
黄萱菁:我觉得如果从媒体角度的话,可能先是看看数据,我始终觉得不管是机器学习还是深度学习,它都是数据驱动的方法,所以数据对我们太重要。
那么现在,社会媒体提供了很多的数据,比如像微信微博、字节、微信、知乎这些数据,社会媒体数据,比如像一些在线的一些行为数据,消费行为、出行行为,这些实际上就给我们提供了很多的财富,它也会展现网络社会和人类行为。像网络媒体有新闻数据、多媒体内容的数据、用户评论的数据,然后甚至还可以叠加到比如像地图的数据等等,它可以有很大的可能性,有了这种数据的话,我们就可以结合具体的应用来看我们怎么样提升现有的方法。
媒体的话,我们就讲采编播。那么实际上的话应该说在采编播的各个环节都可以采用自然语言处理的技术。比如像新闻采集,那么我们可以对新闻做热点的发起、主题的建模、事件的提取,可以在新浪微博上面取得新闻的事件,发现潜在的新闻线索和舆情热点。
微博上不仅有很多内容,它还有用户,用户之间可以构成社交关系网络。那么这样子的话就可以去做很多基于社交网络、基于内容的分析,比如我们可以去分析这个话题的发生发展到逐渐消亡这样一个过程,可以看传播的这种结构、扩散轨迹、内容演化,然后我们可以分析大家就焦点话题的观点,还可以去根据微博热点信息的内容和热度去判断素材是不是可以有价值,这些主要是在采集方面。
访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事
文章插图
社交网络分析 图源:CSDN
那么然后接下来的话我们可以写新闻、编辑新闻,比如我们引入自然语言生成的技术。深度学习,跟以前的方法相比,比较大的一个好处就是说我们以前做的更多的是理解,但现在有了深度学习,我们可以做生成,比如一些好写的事,像球赛,球赛结束了,球赛的中间过程,我们可以很快写出一个球赛的新闻出来,这种是体育新闻。这是比较早的,因为它是可以程式化的一些写法。
访谈|#NLP太难了# 未来媒体访谈对话黄萱菁教授|“NLP+媒体”:科技向善,做有挑战的事
文章插图
英超联赛新闻 图源:新浪体育
那么现在的话随着深度学习技术的进展,比如像外面很火的GPT3,这一类都是有代表性的具有很强大的生存能力的预训练模型,它可以让新闻生成质量越来越高。甚至可以无中生有,当然这是另外一个问题。
另外的话,有了新闻,我们可以做各种各样长度的,比如可以给新闻写摘要,可以适配各种文件,比如在手机这样一种小屏,还有大屏、平板等不同媒介。然后我们还可以写标题、找关键词,比如热搜,对吧?
这些是偏文字新闻,如果是电视媒体的话,我们还可以引入很多多媒体的技术,比如计算机视觉、图像生成,给我一个视频,我可以自动地给他做字幕,对吧?这也可以做。
然后我们还可以从网络视频中间提取新闻、提取热点,我们还可以把多媒体和语言文字可以结合在一起,比如视频中间出现了一个人,比如拜登,马上我们可以给一个链接,对吧?转到他的百度百科,等等。所以这些的话应该是可以提升现在的“采编播”质量,大家都在尝试。
还有很多,你还可以做虚拟主播,甚至可以加直播,可以做虚拟的偶像,这些都行,可以吸引用户的眼球。在新的时代其实可能有很多新的挑战,我有时候觉得我都老了。

推荐阅读