学术之路 | 讲座报名:大数据在社会科学中的应用

清华大学公共管理学院
2021-11-11 18:08 浏览量: 3555

活动提要

近年来,大数据技术在社会科学研究中的运用变得越发常见。这一趋势,一方面归功于大数据分析的相关技术在最近十几年的突飞猛进,另一方面则归功于越来越多的社会现象及人类行为通过电子化的手段保存了下来(如社交网络数据、手机迁移数据、政府公文数据等等)。

值得注意的是,这些纷繁复杂的社会现象和人类行为,相当大比例是以文字为载体的。从分析新冠疫情对公民情绪的影响,到识别社交媒体上的意识形态分野,再到理解政治家演讲中的关键议题,这些有趣的任务都可以通过大数据领域中的量化文本分析技术去实现。

本次活动就以量化文本分析技术为例,探讨大数据技术在社会科学研究的运用

主讲嘉宾介绍

肖诗阳

肖诗阳,雪城大学马克斯维尔公民与公共事务学院(Maxwell School of Citizenship and Public Affairs)社会科学项目(Social Science Program)博士五年级学生,清华大学公共管理硕士,北京大学哲学学士和经济学双学士。

研究方向:产业政策、高等教育、公共政策过程,以及大数据研究方法。

其部分研究已经发表于Journal of Public Administration Research and Theory等高水平国际期刊上。

课程安排

第一天(11月13日)早9:30-11:30

1.大数据在社会科学研究中的基本使用框架及范例

2.文本预处理及中文分词工具Jieba的使用方法

3.词频统计与字典法(Dictionary Method)

4.词袋模型(Bag-of-Words)及其变式(N-gram, TF-IDF)

5.基于词袋模型的文本分类任务(Classification)

第二天(11月14日)早9:30-11:30

1.词向量模型(Word Embedding)的逻辑

2.基于词向量模型的相似度(Similarity)计算

3.主题模型(Topic Model):LDA与STM

4.运用主题模型考察政策文本对各类议题的关注度

备注:讲座分享内容主要基于Python语言,主题模型部分会涉及R语言的使用。

报名方式

本次讲座将通过腾讯会议形式进行,请同学们点击文末阅读原文或者扫描下方二维码填写问卷,完成问卷后扫码添加讲座微信群获取相关信息。

供稿丨研工组

编辑:凌墨

(本文转载自 ,如有侵权请电话联系13810995524)

* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。

收藏
订阅

备考交流

免费领取价值5000元MBA备考学习包(含近8年真题) 购买管理类联考MBA/MPAcc/MEM/MPA大纲配套新教材

扫码关注我们

  • 获取报考资讯
  • 了解院校活动
  • 学习备考干货
  • 研究上岸攻略