选举预测调研
目标
通过机器学习的方式,结合公共信息对台湾的大选结果做出预测。
数据
通常分为以下几类:
- 新闻:媒体所报道的选举相关或候选人相关的新闻;
- 民意调查:不同民间调查机构针对某一次选举在线上或街头做的问卷调查,通常是直接询问被调查者支持哪位候选人;
- 社交媒体:来自 Twitter、Facebook、垂直论坛等线上社区的用户评论内容;
- 宏观经济数据:如金融数据(GDP、就业率等)、人口数据(年龄构成、地区分布等)等;
- 其它:如候选人相关网站的流量与候选人的搜索引擎热度。
方法
UGC 的文本情绪分析
这是较多的论文所采用的方法。
- 用户原创内容(User Generated Content, UGC)
- 中文分词
- 关键词提取(TF-IDF)
- word2vec
- 基于贝叶斯的情绪分析
较宏观数据的拟合预测方法
部分论文采用神经网络为主的拟合方法,因此不一定有预测能力,反而可能滞后。
- 前馈神经网络
- 向量自回归预测模型
民意调查的概率图模型
需要主观建模,模型假设是否有效对结果影响很大。
民意的疾病传播模型
- 扩散模型
信号的卡尔曼滤波器
新闻事件侦测模型
refs
2013-dynamic-bayesian-forecasting-of-presidential-elections-in-the-states 2014-prediction-and-analysis-of-pakistan-election-2013-based-on-sentiment-analysis 2015-buzzer-detection-and-sentiment-analysis-for-predicting-presidential-election-results-in-a-twitter-nation 2015-on-predictability-of-rare-events-leveraging-social-media-a-machine-learning-perspective 2015-using-twitter-sentiment-to-forecast-the-2013-pakistani-election-and-the-2014-indian-election 2016-boosting-election-prediction-accuracy-by-crowd-wisdom-on-social-forums 2016-forecasting-canadian-elections-using-twitter 2017-forecasting-at-scale 2017-prediction-of-the-2017-french-election-based-on-twitter-data-analysis 2017-web-mining-for-the-mayoral-election-prediction-in-taiwan 2018-forecasting-elections-using-compartmental-models-of-infection 2018-prediction-and-analysis-of-indonesia-presidential-election-from-twitter-using-sentiment-analysis 2018-social-media-would-not-lie-prediction-of-the-2016-taiwan-election-via-online-heterogeneous-data 2018-using-neural-networks-to-predict-the-2018-midterm-election 2019-forecasting-the-israeli-elections-using-pymc3
Page Not Found
Try to search through the entire repo.