第0162章 第一篇论文要发表了(1 / 2)

由于cbdb收罗的历史人物太多,重名现象非常严重。

经过一番探索,田立心最终设置了如下的排除重名策略

1、如果人物生卒年俱,那么只要生卒区间和唐朝持续时间有交集即可。如果存在这样的诗人,那么直接把这个人作为唐诗中的作者。

2、如果人物只有生年或者卒年,那么生年或卒年必须在唐朝的持续时间内。将这样的人加入候选人列表。

3、如果人物生卒年都不详,那么舍弃之。

经过这三条判断之后,如果候选人列表为空,那么说明cbdb中没有目标人选,舍弃这位诗人;如果候选人多于一个,则说明排除重名失败,舍弃这位诗人。

这种策略并不完美,依然存在部分注明诗人被舍弃的情况。

为此,田立心又手动添加了某些重名现象特别严重,难易排除的人物比如李林甫、张旭、李贺、李绅等人,同样还要手动删除某些别称比较尴尬,在唐诗中属于常用词的别名,比如李世民的李二,李白的李太白,武媚娘的逍遥,黄巢的皇帝等等等等。

这么一番筛选下来,唐诗中收录的2609位诗人,便只剩下762位了。

好消息是,大家经常能看到的那些诗人都已经包含其中。

这就已经足够了。

接下来,就是给这762位唐朝诗人构建人物关系网了。

论证两个诗人之间关系的亲密度,自然是以互相唱酬为依据的。

比如李白和杜甫,杜甫写过十二首有关李白的诗,李白写了与杜甫有关的诗是三首。

由此可见,李白这位朋友,确实不咋样啊。

互相唱酬排名最高的,则是陆龟蒙和皮日休,两人互动的诗歌多达上百首。

其次,是白居易和刘禹锡、元稹和白居易、白居易和崔玄亮、白居易和李逢吉、皇甫冉和刘长卿、白居易和李勃、白居易和牛僧儒、白居易和李健、白居易和李绅、韩愈和张继、刘禹锡和裴度、白居易和裴度、白居易和张籍、宋之问和沈佺期……

毫无疑问的是,白居易不仅仅和元稹是名副其实的元白,还是唐朝诗人中最核心的人物。

初唐诗人中,以宋之问和沈佺期的关系最为密切,这两人也是宫廷诗人的代表人物,但并没有形成明显的朋友圈。

盛唐诗人中,以白居易、刘禹锡和元稹为核心的朋友圈最为庞大,李白和杜甫的朋友圈则比较边缘化。

到了晚唐,最著名的诗人就是有小李杜之称的李商隐和杜牧了,其次是皮日休和陆龟蒙,但晚唐诗人的交际圈并不算大,经常联系的也就五六个好友之间而已。

得到了计算机的运算结果之后,田立心便开始建立了数学模型。

随后,就是撰写论文和编程了。

从准备论文到寻找参考文献,继而将这篇论文完稿,田立心用了差不多整整半个月的时间,而用同样的思路写出的有关埃数的论文就简单多了。

田立心将三篇论文一一写完,时间便已悄然进入了十月中旬。

这时候,《疯狂的石头》上映已经将近二十天了。

第一周的三天,这部电影在京城收下的票房只有三百五十万,国票房差不多五百万的样子。

但在第二周,这部电影在京城的票房就收下了一千万,国票房累计两千万。

同时,《疯狂的石头》也在香江开始上映了,十天时间收下了三百多万的票房。

这也意味着,请刘青芸出演的成本已经能够收回了。

第三周,京城票房的收入仍然保持在一千万左右,国票房已累计超过三千万了。

这样的成绩,已稳稳排在今年票房榜上的第二名,算是压住了今年的几部进口片《星战前传1》、《偷天陷阱》、《花木兰》、《尖峰