基于情感分析的巴基斯坦 2013 年选举预测与分析

@liangyh

  • 应用
    • 选举预测
  • 数据
    • 社交媒体
  • 方法
    • 文本情感分析

摘要

社交媒体的重要性已经被证明在促进发展中国家的舆论转变,改善民主选举过程中具有重要意义。相反,缺乏基本生活必需品的发展中国家实行垄断性选举制度,根据部落、家庭背景或地主影响选举候选人。他们勒索选民投票反对他们提供基本需求的承诺。同样,选民也为个人利益投票,而不知道党的宣言或国家利益。这些问题可以通过社交媒体解决,作为目前通过的选举程序的持续改进过程。巴基斯坦人民利用社交媒体在2013年大选中为政党赢得支持和竞选。巴基斯坦的政治领导人、政党和人民在推特上传播党的议程和宣传党的意识形态,而没有花费太多的竞选费用。为了研究从个人政治行为推断出的社交媒体的有效性,进行了大规模分析、情感检测和推文分类,以便对选举结果进行分类、预测和预测。实验结果表明,社交媒体内容可以作为捕捉不同政党政治行为的有效指标,通过分析可以预测政党追随者的积极、消极和中立行为以及政党的竞选影响。分析结果证明与巴基斯坦选举委员会公布的实际结果有相当大的一致性。

主要内容

作者将针对某一方表示赞赏或表示满意的推文被标记为积极的推文,针对某一方的包含负面词汇、表情符号的推文被标记为负面推文。没有显示出任何倾向于任何政党的推文,但与大选竞选活动有关的推文被称为中立推文。这一步是通过人工筛选来获取训练集 之后选取互信息最高的一组词(uni-gram)作为特征向量,并且为了平滑单词概率、避免0值的出现,使用了拉普拉斯方法,使用多种分类算法进行有监督的训练,之后通过TF-IDF对测试数据进行特征抽取。 模型训练好之后,预测数据的来源为提及包括政党名称,政治名人和参与政治运动的人等关键词的推特。

创新点

使用特征抽取、词向量处理句子并用分类算法对推特数据进行整体的情绪判断。

Page Not Found

Try to search through the entire repo.