中读

我是不是有点皇亲国戚?

作者:向帆

2017-06-22·阅读时长4分钟

1456人看过

最近几个月,我们一直在集中地理解一个庞大的数据库,它的名称是中国历代人物传记资料库(简称CDBD)。


首先是因为这个数据库本身让人感动,因为它在1980年(我们还没有开始使用计算机的时候)就由美国哈佛大学的著名汉学家郝若贝教授(Robert M. Hartwell,1932-1996)与其夫人为了研究中国古代社会史和经济史所创立,多年来经过哈佛大学、台湾中央研究院、北京大学的共同开发而成。


另一方面,这个中国古代人物的数据库,从传记资料索引、史料、文学作品、官方文书等收录了七世纪至十九世纪的37万人的专辑资料,把中国古代历史文献中的人物生平汇聚一体,并转化为数据,让我们有机会以一种新的方式来阅读中国古代人物关系。这不是一家之说,而是汇集各家之说,让我们可以通过比对来发现错误、问题。 这样听得太理论? 欢迎看看我们闯入这个中国历史硬盘所复刻的风景。


虽然中国的历史太长、太长,但是我们还是很贪婪地想一观历史的样子。 于是,我们本能地想像一大片中国人的家族森林,每一家都如同散落在中国大地上的大树,历经千年成长,也许我们甚至有机会知道自己从哪里来?

工程师有私心,先做了自家朱氏的数据,下面就是朱家森林:


历史的朱家森林


每个小点就是一个历史文献上有所记载的名人,简单说就是中过举、做过官、当过皇帝的朱姓人氏。那些连在一起的人就是一家人。


历史上最完美的一家朱家大树


这是一个始于唐代的朱姓大家,我们让它按黄金比例生长。仔细看是不是树的右边结构很奇怪呢?怎么可能如此生长呢?这个眼睛可以快速发现的问题,就是历史文献之间的错误所在,让人可以很快大海捞针,为历史学家提起新的问题。 为什么这一家的家谱如此完整呢? 经过文献查询,这可正是一个大家,连毛泽东都评价过正中一枝的节点人物:朱敬则(公元635-709年)。


右上方生出的一条长枝,明示了原始数据的问题。


当然,我们都会渴望知道“我从哪里来?”,是不是真有点皇亲国戚?在做研究的时候我们开了一次小差,比拼了各家族势力:



王姓的森林很大很杂乱

当然,我们都会渴望知道“我从哪里来?”,是不是真有点皇亲国戚?在做研究的时候我们开了一次小差,比拼了各家族势力:



历史纪录证明:王者胜


当然冼枫老师的家族树我们就不打算画了,因为他家好像连一根线都连不起来。


很多历史学的研究者对我们的研究非常感兴趣,但是也有人提出“工具理性”,对数字媒体要警惕等观点,也有朋友问我们这个研究究竟“有什么用?”。 其实,我们想做的事情不是论证某个历史研究的问题,而是提出一种新的研究工具,宏观地呈现中国历史痕迹;具体来说,这个工具可以让历史学家立刻可以在大海里捞出一些针,或者看见时间的、空间的趋势。


让我们用隔壁小明的案例来解释这一切。美国《科学》杂志发表过一篇量化社会科学的论文《一个文化史的网络框架》表达了我们相同的志趣。这个贯通两千年的文人和艺术家的生死时空数据视觉化作品,让我们可以看到几个世纪以来的人口移动趋势,文化中心地点的改变。


从四面八方而来的文人、艺术家们大都在重要文化中心城市离开人世。(红渐变到蓝色:出生至死亡)


你看,文化艺术的中心从罗马开始慢慢地转移到了巴黎和伦敦,在德国却是弥漫开来的。


上图显示,最近一千年来,艺术家们看来还是最爱在伦敦与巴黎成仙。


曾经有一天下午,我的老师Jan在他位于与美国麻省剑桥市Porter Square的小屋里轻松地说:“ 我打算以后死在这里”。一个人可以死在自己喜欢的地方,尤其是一个庭前种日本枫的精致小屋里,实在是个非常美的画面啊。


最后,我想分享这篇论文的摘要,帮助解释我们眼前针对中国历史人物数据库(CBDB)的工作意义:




手机端的《科学》杂志的原文


“历史是由突变的事情所推动的,而突变本身是大量复杂个体之间的交互所导致的产物,因此,历史是由难以量化的历史条件所决定的。为了描述这个过程,我们通过15万以上名人的出生和死亡地点,重构了一个超越两千年的知识分子迁徙图。


我们运用网络工具和复杂的理论识别数据中的统计性特征,并确定文化和历史之间的相关性。最终所形成的地点网络图提供了一个宏观的文化历史视野,帮助我们能够运用大尺度的视觉化和定量的动态工具去回溯欧洲和北美的文化叙事,并推导出文化中心的历史趋势,最终让历史研究的方法超越具体事件的视野或狭窄的时间区间。

量化历史发展对于理解从人口变化到疾病传播、冲突和城市进化等等大量复杂过程是至关重要的。然而,在历史研究中定性分析和定量分析之间有一种与生俱来的矛盾,其中定性分析关注个体的历史记录,定量分析则针对测量并建立通用模式。我们认为这两种方法是可以互补的:我们需要量化的方法来发现统计性规律,也需要定性的分析来解释已知通用模式中局部偏离所带来的影响。我们因此开发了这样一种可以合成定量和定性分析的方法,它是由数据生成的宏观视野。” [引1]

引用:1. Maximilian Schich et al., A network framework of cultural history 《一个文化史的网络框架》,  Science, 345, 558-562, 2014

说明:本文前四幅家族树的数据来自「中国历代人物传记资料库」(CBDB)項目(网址https://projects.iq.harvard.edu/chinesecbdb)。

致谢:哈佛大学CBDB项目博士后研究员徐力恒先生、项目经理王宏甦先生。

向帆 朱舜山

2017年06月22日于清华园

www.zeelab.xyz


文章作者

向帆

发表文章5篇 获得9个推荐 粉丝77人

清华大学美术学院 / 设计研究者

中读签约作者

现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里

下载中读APP

全部评论(2)

发评论

作者热门文章

推荐阅读