舆情监测分析工作的2大基本模式 舆情监测报告,( 二 )


2)扩展舆情信息的广度与深度 。 舆情信息来源不断趋于多样化 , 从传统的新闻网站、论坛 , 发展到微博、微信等社会化网络应用 。 网络舆情监测不可能捕获全网信息 , 但零星而起的网络言论会在不同网站、网页、网民群体之间迅速酿成热点 。 准确把握舆情态势 , 防止监测分析片面化 , 需要增加信息来源范围 , 不断扩展信息采集的广度与深度 。 在信息来源的广度上 , 网络应用类型与站点数量就显得非常重要 。 比如 , 涉军网络舆情采集包括 , 军事网站及主流媒体军事频道发布的军事新闻及网民跟帖;军事论坛中 , 网民的各类贴文;军事博客与网民回帖;微博和微信等社交媒体应用 。 其中 , 微博相对数据开放 , 与传统博客类似选择其中部分微博 。 微信主要限制在个人通讯范畴 , 但可以采集微信公众号信息 。 扩大采集范围可能会带来大量无关数据 , 可以在采集器上做出一定限制和过滤规则 , 减少采集到过多无关信息 。 在信息深度上 , 解决一些网站需要用户登录、页面分页分层、网页自动探测、用户密码、验证码等问题 。
3)提高舆情监测分析的自动化程度 。 一般舆情系统都包含自动聚类、分类等数据挖掘通用功能 , 提高了舆情分析的自动化程度[4] , 但各类功能的针对性不强 , 大量工作在实际中仍需繁琐的手工完成 , 难以满足舆情报告撰写等实际需求 。 所以 , 需要结合实践特点 , 制定和拓展结构化的模板和定制化的功能 , 提高舆情分析工作的效率 。 比如 , 利用舆情报告模板、图形图表模板、观点分类功能等进一步减少手工工作 。 同时 , 可以利用不同站点、不同类型的网页信息 , 交叉验证舆情信息 , 增强网络信息的自动融合 , 提高舆情分析的准确性与及时性 。 在工作流程上 , 实现网络舆情信息采集、整理和分析自动化 , 才能从繁杂的信息收集和整理中解放出来 , 集中精力进行舆情分析和报告撰写工作 , 提高工作水平和效率 。
4)提升舆情信息内容分析的语义化与技术水平 。 信息内容分析是网络舆情工作的关键 。 大多系统都是基于词语匹配完成聚分类任务 , 以此实现既定的舆情内容分析功能 。 但意义关联的近义词、同义词与相关词的词形不同 , 必然在准确率与召回率方面存在不足 , 比如舆情话题追踪、观点分类的性能会受到明显限制 。 而且内容相同或相近的新闻、帖文必然出现在不同网站页面 。 准确关联汇聚这些信息 , 是全面准确把握舆情整体状况的重点前提 。 广泛利用信息 , 需要开发利用一定的算法 , 整合语义知识库 , 才能综合提高舆情信息的语义关联化程度 , 加强对网络舆情状况的判断 。 所以 , 舆情监测分析的语义与智能化水平亟待加强 。 一个方法是基于语义知识提高分析的准确程度;再一个是利用当前的最新技术 。 比如 , 深度学习方法在很多领域已经证明了其有效性 , 综合利用 word2wector、深度神经网络等提升内容分析的准确程度 。

推荐阅读