信管讲堂 | “‘火眼金睛’:数据驱动的网络虚假健康信息识别研究”讲座顺利举行

中国人民大学信息资源管理学院
2021-06-07 23:49 浏览量: 3109

为激荡科研思维、促进学术创新、培育信管青年科学家,2021年6月4日周五19:00,由中国人民大学信息资源管理学院主办、中国人民大学信息资源管理学院研究生会承办的“人大信管讲堂·青年科学家一小时讲堂”系列讲座第26讲以腾讯会议直播的形式在线上顺利举行。

本期讲堂邀请到南京大学信息管理学院专职教研岗赵月华博士,赵月华博士于美国威斯康星大学密尔沃基分校获得博士学位,研究方向:健康信息学、社交媒体数据挖掘、科学计量学。本期讲堂主题为“‘火眼金睛’:数据驱动的网络虚假健康信息识别研究”。讲座由中国人民大学信息资源管理学院研究生会执行主席、2019级档案学博士研究生管清潆主持。

赵月华博士分享了有关识别虚假健康信息方面的研究成果,主要包括为什么要识别虚假健康信息、如何识别虚假健康信息、融合行为特征的在线健康社区虚假信息识别研究和讨论及展望四个部分。

首先赵月华博士指出随着“互联网+医疗健康”以及“健康中国2020”战略等政策的出台和引导,在线健康医疗的服务进入了一个繁荣发展的阶段,很多平台和应用都提供了全面的在线医疗服务。在线健康医疗服务的发展也体现出民众对于健康信息的关注程度日益上升,健康信息的需求非常迫切。与此同时,互联网上的健康信息则存在网络内容真实性存疑、网民信息素养不足、疫情期间虚假健康信息频现等问题。

接着赵月华博士介绍了识别虚假健康信息的相关研究,包括如何识别虚假评论、网络虚假新闻/谣言识别。

在第三部分中,赵月华博士介绍了自己团队的虚假健康信息识别方案。她首先讲解了选择在线健康社区进行研究的原因,然后介绍了该研究想要构建基于理论的识别框架的目标以及选择特征的原因。接下来,她介绍了研究选用的详尽可能性(ELM)模型,并基于此模型提出了在线健康社区中虚假信息识别框架。在实验部分,研究思路主要分为数据采集、编码分析、特征提取、模型构建四个阶段。研究选择百度贴吧自闭症吧作为数据来源,采集了十五万条记录,通过分层抽样的方法抽取了五千条记录,由五位编码员编码后进行特征提取。赵月华博士对于选取的特征进行了详细的介绍,并分享了模型训练采用的方法和最终的实验结果。

最后,赵月华博士总结了她的研究发现及对未来研究的启示。虚假信息识别的难点在于数据集的获取,而目前虚假健康信息识别领域缺少可供使用的已标注数据集。虽然在这个研究中将在线健康社区当中的虚假健康信息分为了广告、推广以及不实信息三个类型,但在未来这个分类方案还需要更多的验证。此外,在这个研究中提出的融合行为特征、语言特征和情感特征的方案相比仅依赖文本特征有着更好的识别性能,而接下来可以考虑基于深度学习算法对更多场景下的虚假健康信息进行研究。

发言结束后,参会者对赵月华博士的精彩分享表示了感谢,并就研究开展的一些细节进行了探讨。至此,“人大信管讲堂·青年科学家一小时讲堂”系列讲座第26讲顺利结束。

编辑:凌墨

(本文转载自RUC信息资源管理学院 ,如有侵权请电话联系13810995524)

* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。

收藏
订阅

备考交流

免费领取价值5000元MBA备考学习包(含近8年真题) 购买管理类联考MBA/MPAcc/MEM/MPA大纲配套新教材

扫码关注我们

  • 获取报考资讯
  • 了解院校活动
  • 学习备考干货
  • 研究上岸攻略