然而,当时没有足够文本的数据库来使其实用。早期的计算机在文学方面的知识并不如普通研究生那么丰富。 然后谷歌图书出现了。谷歌试图将世界上所有已出版的材料纳入其贪得无厌的信息胃中,这对图书馆或作家来说可能不是一个突破,但对数据科学家和像安德伍德这样具有分析头脑的文学分析师来说却是一个突破。 在谷歌出现之前,数字文学分析很像模拟:阅读、反应,也许还计算正在研究的事物(地点、代词、金钱等)的出现次数。但现在,借助 Google 图书,安德伍德可以创建不是针对片段或整本书的统计模型,而是针对整个类型的统计模型。科幻小说、悬疑小说、浪漫小说……它们有何不同?他的著作《遥远的地平线》试图回答这个问题。