菲利普球 自然 magazine

如果只有你,你可以预见阿拉伯春天'D一直在向新闻报告。那'据了一项新研究的主张,了解新闻报道的数据挖掘如何在发生之前可以揭示未来危机的可能性。

计算机科学家Kalev Leetaru在Urbana-Champaign的伊利诺伊大学通过广泛的新闻报道汇编并审查了'tone'关于突尼斯,埃及和利比亚的消息,其中长期以来的独裁政治领导人被共同称为阿拉伯春天所知的公共上行所吸引。他说,在所有情况下,他说,在革命前大约十年的负面地呈现出明显稳定的趋势。

虽然这一趋势不起作用'TETARU认为,预测今年早些时候发生的事件的课程或时间,据称它提供了即将到来的危机的明确指标。 "这类工作的价值在于改变情绪和环境的警告,并增加突然震动的脆弱性," he explains.

哈佛大学Erez Lieberman Aden在马萨诸塞州剑桥的Aden,他探讨了数字化文学文学的挖掘,为语言和历史趋势,同意。"Leetaru'由于它使预测,但是由于它的预测,因此,这是有趣的,而且因为它指向了分析大规模新闻数据库的新方法的权力和机会潜伏," he says.

苏黎世瑞士联邦理工学院(Eth)的政治科学家Thomas Chadefaux呼叫论文"对一个野外政治学 - 政治学 - 这对寻找战争的早期预警信号或完全取得预测,这很少".

漫长的观点

长期趋势可能是通过主观和部分监测来微妙的,难以解决新闻。但他们可能会比短期内的重点更可靠地展示危机。例如,虽然2011年3月在沙特阿拉伯的相似公众上令人兴奋的可能性期间有谈话,但在那个月的新闻中反映了一个相当负面的语气,长期数据显示法术不比其他波动差近年来 - 没有恶化的趋势。在此基础上,人们会预测阿拉伯春天的失败,以取消沙特统治者。

"如果我们今天想到我们周围的大量数字信息作为信息之海洋,那么我们'在很大程度上一直在研究表面,"Leetaru说。他认为,寻找有关情绪,音调或空间引用的自动新闻分析可以提供类似于政治事件的天气预报,也许是"每隔几分钟为整个星球提供更新的评估,并指出可能需要进一步调查的新兴模式", he suggests.

Leetaru.在世界广播摘要中使用了巨大的新闻报道,这是英国情报服务在第二次世界大战之前设立的监测服务,以评估世界意见。该系列现在包括来自130多个国家的报纸文章,电视和无线电广播,期刊和各种其他在线资源。

以前的提取措施'buried'来自广大文学资源的信息 - 一种被称为的方法'culturomics' - 倾向于关注量化某些关键词或短语的发生。相比之下,Leetaru进行了'sentiment mining'通过评估它们的积极或负面的基调来源,寻找诸如的评估词'terrible', 'awful' or 'good'。他使用计算机算法将这些数据转换为单个参数,这些参数量化新闻的音调,归一化,使得长期平均值为零。

跟踪基调

对于埃及,2011年初的基调在过去三十年之前只有一次看到的负值。什么'更多,覆盖范围的基调特别提及Hosni Mubarak,埃及'现在统治了近30年的总统于2011年初达到了最低的水平。突尼斯和利比亚发现了类似的尖锐瀑布。

因此,仍有待观察到这种方法是否可以提前发现麻烦的迹象,而不是回顾性地发现它们预示在媒体中。"当你知道看哪看哪,在看哪一点时,它显然更容易找到它盲目的位置," says Chadefaux.

这没有'T本身预测这些危机会发生。例如,它似乎可能是飙升的食物价格有助于引发阿拉伯春令的革命。但是这种趋势可能会揭示当一个地区或国家对动荡成熟时。 Eth Zurich的Dirk Helbing是一种建模社会系统的专家,将其与交通流量的情况进行比较:计算机模型可以帮助发现流量处于潜在不稳定状态时,但果酱的实际触发器可能是随机和不可预测的。

但如果新闻挖掘确实提供了一个水晶球,"问题是我们的使用方式'll制作这些信息," says Helbing. "政府会以响应方式行事,以避免危机,通过改善人民来说'S的生活条件,或者他们将用它以预防方式对警方不满意的人呢?"

本文以杂志自然的许可复制。这篇文章是 第一次出版 2011年9月13日。