中读

用大数据研究文学的发现

作者:三联生活周刊

2019-03-20·阅读时长2分钟

1029人看过

本文需付费阅读

文章共计1089个字,产生11条评论

如您已购买,请登录


(图 谢驭飞)


文/茸成

一个学数学的人可以热爱文学,但也许他只是刚好拥有这两种不同的爱好而已,就如同一个学物理的同时也喜欢听摇滚。华师大数学系教授周克希后来转行去做翻译,他就说,翻译和数学并没有多少关系。但华师大中文系教授陈大康本科学的是数学,他上世纪80年代起就用数学研究文学,发表了《人物性格的数学抽象与定量分析》《从数理语言学看〈红楼梦〉后40回的作者》等文章。毕业于哈佛大学应用数学专业的美国记者本·布拉特用大数学分析了众多经典文学名著和畅销书,他说:“在任何一个领域,如果拥有数十万个数据点,那么对这些信息进行挖掘一定有助于研究人的行为和心理。我相信,挖掘文学同样是有效的。”

布拉特统计了作家们最喜欢用的词,因为“作家最喜欢的词能反映他们作品的独特语气或主题”。他的分析结果和我们对作家的印象确实比较吻合,比如华裔作家谭恩美最喜欢的词是“葫芦”“花生”和“面条”,简·奥斯丁最喜欢的词是“礼貌”“幻想”和“轻率”,爱喝酒的海明威最喜欢的词里有“干邑”,J.K.罗琳最喜欢的词是“魔杖”“巫师”和“魔药”,纳博科夫最喜欢的词依次是“淡紫色”“平庸的”和“双关语”。

文章作者

三联生活周刊

发表文章6041篇 获得11个推荐 粉丝47966人

一本杂志和他倡导的生活

中读签约机构

收录专栏

成为父亲

爸爸们的问题与困惑

9099人订阅

现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里

下载中读APP

全部评论(11)

发评论

作者热门文章

推荐阅读