利用 Twitter 情绪预测巴基斯坦2013年选举和印度2014年选举

@yangyp

  • 应用
    • 选举预测
  • 数据
    • 社交媒体
  • 方法
    • 文本情感分析
    • 扩散模型

摘要

2013年5月8日,即巴基斯坦大选前一周,第三位作者在情绪分析研讨会的主题演讲中预测了巴基斯坦大选的获胜者。图1中的图表显示了该选举中巴基斯坦总理候选人的不同情绪。第二天,英国广播公司的欧文贝内特琼斯在伊斯兰堡的报道中写了一篇题为“巴基斯坦选举:为什么投票不可预测的五个理由”的文章,其中他声称选举太接近了。事实并非如此,尽管他在巴基斯坦,但选举的结果与我们预测的完全一样。 我们想知道这些预测是否可以提前做好。为了检查,我们使用了印度选举推文数据库(IET-DB),这是一个数据集,我们用来自超过1600万Twitter用户的超过2300万条推文,以及一个由超过4000万条边组成的网络。自2014年1月以来,我们能够对印度大选的结果(即谁将成为总理)进行每日预测。在印度大选结束前两个多月,2014年3月6日第三次作者在情绪分析研讨会上的讲话中公开了第一次预测。使用社交网络分析和方法的复杂组合,从Twitter数据自动学习扩散模型,我们可以准确地预测选举的胜利者 - 因为它是实时的,我们能够经常更新预测。我们甚至能够预测最具影响力的个人在社交媒体上的特定主题,允许潜在的候选人在未来使用这些知识来更好地塑造他们的竞选策略。本文的目的是解释我们是如何做到的

主要内容

我们使用了印度选举推文数据库 (IET-DB),这是一个由1600多万Twitter用户的2300多万条推文组成的数据集,以及一个由4000多万条边组成的网络。我们分析每条推文中关于话题t表达的情绪Sen(tw, t)。情绪Sen(tw, t)的得分范围从-1(“最大负面”)到+1(“最大正面”),并使用AVA(形容词-动词-副词)情绪分析算法的自适应计算。因此,IET-DB中的每条推特tw都被贴上了它所提到话题的情绪评分。 自2014年1月以来,我们每天都能对印度大选的结果(即谁将成为总理)做出预测。利用复杂的社交网络分析和方法,从Twitter数据中自动学习扩散模型,我们可以准确地预测出选举的获胜者——而且,由于是实时的,我们能够及时更新预测。我们甚至能够在社交媒体上预测最重要的个人话题,让未来的潜在候选人利用这些知识更好地制定他们的竞选策略。 不过,理想情况是研究所有可能竞选公职的政治候选人及其政党。由于资源有限,我们只研究了1000多个这样的“主题”中的31个。虽然我们能够准确地预测出获胜的首相候选人,但我们不能仅通过研究500多场竞选中的31场就预测出一个政党将赢得多少席位。这表明,要预测政党和联盟的动态,需要更广泛的数据。同时,模型收集数据时间较长,需要缩短收集的周期。

Page Not Found

Try to search through the entire repo.