中国近现代观念起源研究和数据库方法(2)
作者:佚名; 更新时间:2014-12-07

 

1997年开始,我们相继推行过几个研究计划,①着手建立“中国近代思想史研究专

————————————————

      这一系列研究计划如下:1997年香港研究资助(RGC)资助的为期两年的研究计划:“A Quantitative Study of the Formation of Certain Modern Chinese Political Concepts(CUHK4001/97H)”;2000年蒋经国国际学术交流基金会资助的“An Intellectual Historical Study on the Origins and Development of Liberalism in Modem China 1736—1927(RG018-D-99)”;2002年4月中文大学资助的“Data Mining for the Quantitative Database of La Jeunesse:Reasearch of the Interactions between the Changes in Political Concepts and Important Incidents during the New Culture Movement”;2002年9月开始香港研究资助局(RGC)资助的新研究计划“A Quantita-tive Study of China’s Selective Absorption of Modern Western Ideas and the Origins of Certain Key Concepts(1840—1915)(CUHK4006/02H)”。在此,我们对以上资助机构致以谢意。本文写作过程中,承蒙戚立煌先生、吴通福先生、黄庭钰小姐、增田真结子小姐做数据处理、日文文献摘要等多方面的协助,谨致谢忱。

 

业数据库(1830—1930)”,目前这个数据库已初具规模,并在不断扩充和完善之中。①我们已经通过若干个关键词在这约六千万字数据库中的追踪、意义挖掘来分析用这些关键词表达的若干重要观念如何起源及其演变轨迹。本文通过对我们近年来研究的综述,介绍我们用数据库方法在中国现代观念起源研究中的一些发现以及对中国近现代思想史分期的新看法。我们认为,一种以关键词为核心分析对象的数据库研究方法正在迅速形成,在思想史研究中将占据越来越重要的位置。其方法和以往的思想史方法有如下差别:

 

第一,观念史研究基本单位不再是以文章为中心而是以句子为中心。我们知道,以往思想史研究中分歧最大的是如何正确解读文本。从中抽象出观念的典型形态(ideal type)。由于对文本解读本身的复杂性,对其表达的某些观念理解可以存在着巨大差别。现在我们研究碰到的基本单位不是文章,而是文章中具有某一个关键词的句子。虽然在很多时候判断某一关键词在这一句话中的意义时,必须去看上下文,但根据句子来判断某一关键词的意义,具有相当大的客观性。而且从句子来区分关键词有几种类型,比从一篇文章来判断其中某一观念形态要准确得多。

 

第二,当以文章为基本单位时,从中抽取观念的典型形态只能靠一篇或数篇文章,文本不可能对观念是否普遍、该思想是否流行提供直接的检验。现在既然以句子为基本单位,我们可以将数据库中某一历史时期使用该关键词的所有句子寻找出来。在这数以千计甚至是数以万计的句子分析中,关键词意义类型明确,这些意义类型中哪些是普遍的以及如何变化,则完全可以进行统计检验。

 

只要承认上述两个前提,一种以关键词分析为中心和以往思想史研究不同的研究方法就可以建立。它分为如下几个基本步骤:研究的第一步是寻找和选取代表重要新观念的关键词,并利用数据库检索表达该观念的一个或一组词汇及其按年代分布频度;第二步是提取所有相关例句,再由研究者解读每一个例句(随着数据库的扩充,往往可能找出数以千计或万计的数据),以确定该关键词的意义类型。我们可以掌握该关键词在例句中表达的不同意义类型及各种意义按年代演化的过程。第三步,以此做为基本素材,再分析中国传统观念以及中文中该关键词原意,何时以及为何要用该词表达新观念;如该词是中文中本来没有,则必须分析它何时传人以及普及的过程。与此同时,还必须比较该关键词意义在历史上的变化;确定某一时段其主要意义以及分析相关中西传统的观念差异。除此以外,还可以通过对文本作出深度解读挖掘出其它统计数据,如对文本所涉及的中外人物、事件、学说、征引文献作出标识,就有可能建立规范性意义分析的数据库。[5]数据挖掘方法可以实现人手很难完成的名目繁多的事项间的相关性分析,从而启发新思路。而系统运用上述方法,则需要与不同学科、特别是语言学的合作。

 

必须指出的是,上述三个步骤都是技术性的,而研究工作的成败则取决于我们能否有效地利用挖掘出的大量数据作出具有说服力的假说。换言之,不断扩充数据库文献的总量和改进系统功能,始终只是研究的辅助工具。而如何对统计分析结果,做出更为细致深入的解析疏理,从而勾勒出观念演变的线索,仍然依赖研究者的创造和综合能力。至于结合历史背景和文本结构分析,概括出某一时代普遍观念的ideal type,依然是思想史研究的基本方法。数据库方法运用的贡献,主要表现在观念史研究从此可以突破以往用个别代表人物和代表著作的局限并使得思想史研究成为可以检验的。

——————————————

  本文根据“中国近代思想史专业数据库(1830~1930)”(香港中文大学中国文化研究所当代中国文化研究中心研究开发,刘青峰主编)做出相关分析统计。以下简称“数据库”,()括号中以万字为单位。

本文使用该库所涉文献简目如下(约6千万字):

一、近代重要论著:冯桂芬:《校邠卢抗议》(5.5);王韬:《弢园文录外编》(21);马建忠:《适可斋记言记行》(11.5);何启、胡礼垣:《新政真诠》(31),郑观应:《盛世危言》(13.6);康有为:《实理公法全书》(1.8)、《新学伪经考》(24)、《孔子改制考》(22);严复:《严复著译全集》(279);张之洞:《劝学篇》(4.3);苏舆:《翼教丛编》(13.7);徐继畲:《瀛寰志略》(22);魏源:《海国图志》(100);郑应观:《易言》二十卷本(2.4)、《易言》三十六卷本(7.6);许楣:《钞币论》(1.6);陈衍:《戊戌变法榷议》(1.3);薛福成:《筹洋刍议》(3.4);宋恕:《六字课斋卑议》(5);谭嗣同:《仁学》(5.6);章炳麟:《訄书》(105);容闳:《西学东渐记》(6.6);梁启超:《饮冰室合集》(700);陈天华:《警世钟》(2.6);刘师培:《攘书》(3.4)。

    二、官方文献:王彦威、王亮辑:《清季外交史料》(426)。

    三、近代期刊:《东西洋考每月统纪传》(24.6);《时务报》(226);《知新报》(380);《湘学新报》(80);《实学报》(37);《清议报》(250);《新民丛报》(508);《国民报汇编》(9.2);《外交报》(749);《湖北学生界》(37);《江苏》(70);《安徽俗话报》(27.6);《二十世纪之支那》(4.3),《洞庭波》(3.9),《汉帜》(3.1);《庸言》(256);《甲寅》(129);《大中华》(32)。

    四、传教士中文著译:丁韪良译:《万国公法》(9.9);傅兰雅:《格致汇编》(173.5)、《佐治刍言》(8.8);李提摩太等译:《泰西新史览要》(40);林乐知、蔡尔康编:《中东战纪本末》(75.7)。

    五、近人编重要政论选辑:张枬、王忍之编:《辛亥革命前十年间时论选集》(211.1);翦伯赞:《戊戌变法》(42);郑振铎编:《晚清文选》(79).

    六、新文化运动重要期刊:《新青年》(560)、《每周评论》(47)、《新潮》(158.2)、《少年中国》(273.6)、《向导》(281.7)。

  尝试之一:检验已有论说和观点

 

思想史研究结论可以通过关键词统计加以检验,这是我们最早得出的结论。1997年,在探讨观念史研究中使用计量方法的第一阶段,我们与复旦大学历史系师生合作,选取了《新青年》、《少年中国》、《新潮》、《每周评论》、《建设》、《努力周报》、《向导》、《解放与改造》、《醒狮周报》、《甲寅》、《现代评论》、《星期评论》等12个新文化运动中最重要的期刊作为研究对象,以检验有关新文化运动中普遍观念变化的有关论述。①这12种杂志总字数约三千万,其时间分布、杂志类别以及互相重迭关系如图一所示。图一中,纵坐标OA对应的是知识分子群体言论的几种刊物,与OB对应的则是有代表性的党派刊物;横坐标OC是年代,可见上述12种刊物断续相接,较为完整地涵盖了新文化运动整个时段。②因此我们认为,它们基本涵盖新文化运动时期不同思想流派和各种知识分子群体的意见,较完整地包含了观念变迁的信息。

 

中国近现代观念起源研究和数据库方法

 

众所周知,五四新文运动是中国现代思想形成的时段,以往有关研究中最著名的一个论断是:科学与民主是新文化运动的两面大旗,代表引进西方最重要的两个新观念。“科学”的广泛使用意味着启蒙思想对理性的尊重;而“民主”则张扬平等、大众参与、个人权利等新价值。“科学”和“民主”被认为是同等重要并且是反传统和建构新文化之利器。这两个新观念如车之双轮、鸟之两翼推动着中国现代政治观念的确立。长期以来,该论断很少受到质疑。

 

我们利用数据库考察了“科学”和“民主”两个关键词在几种新文化运动期刊中使用的频度和意义类型,初步结果已大出所料。[6]《新青年》中“科学”一词共出现1 843次,而“民主”只有1 067次,加上“德谟克拉西”、“德先生”总共是1 283次,只有“科学”的70%。是不是我们忽略了表达民主观念的其他词汇呢?于是,信捷职称论文写作发表网,我们又找出与其意义相关的“民治”(253次)、“民权”(125次)、“平民主义”(20次),加起来总和仍小于“科学”。这一现象是否与《新青年》的社会主义倾向及其后的马克思主义立场有关呢?于是,我们又考察了以时评为主的《每周评论》,其出版时间1918—1919年,当时马克思主义影响力尚不大,该杂志中“科学”出现了117次;“民主”只有44次。其他思想倾向的杂志,如拒斥马克思主义、坚持自由主义思想倾向的《新潮》中,“科学”一词出现1 170次,“民主”加上“德谟克拉西”才共有175次;国家主义倾向的《少年中国》杂志亦大致如此。由以上最简单的统计可见,即使在新文化运动自由主义思潮中,民主观念也可能远远没有如科学那样受到重视。很可能,关于新文化运动中科学与民主并重的论点,是研究者根据代表人物——如新文化运动的主将陈独秀的言论得到的。初步运用计量研究至少已可以质疑以往用科学和民主两面大旗来概括新文化运动的论断的准确性。

 

当然,仅仅依靠“民主”出现频度低于“科学”,并不能否定这两个观念并重的观点,更重要的证据是人们使用这两个关键词时对它们的评价。为此还必须进一步分析《新青年》中作者使用“民主”和相关的关键词时的价值取向,我们分别用+、0、-代表正面、中性和负面评价,得到表一。表一中,可以清楚看到《新青年》作者群对民主观念的评价令人惊异的变化轨迹:新文化运动初期对民主观念的负面评价甚少,反映出人们一致推崇的民主价值;往后,“民主”由单纯明确的界定变为具有多重不确定的含义,1920年、特别是《新青年》变为共产党机关报以后,对“民主”评价越来越趋于负面。在《新青年》杂志中对和“民主”有关理念正面评价的关键词使用只有404次,而负面评价的使用达764次。相比之下,“科学”一词在《新青年》中不仅使用频度高于“民主”,而且几乎全是正面使用;再结合我们在前文所举的其他刊物使用“科学”一词的频度分析,我们就可以得出一个与以往观点不同的结论.这就是:在新文化运动中科学和民主虽然是新知识分子极力要推广的两种新观念,但实际上这两种观念却并不对等。“科学”被不同思想流派的知识群体共同推崇,一直是新文化运动中反迷信、反传统的符号,也是后来提出的新人生观的基础,成为建构新政治文化的要素;而“民主”不但使用频度相对较少,其价值也越来越受质疑。从这一结论来看整个20世纪的中国政治文化,也可以解释为什么此后民主和科学在中国现代观念中的命运如此不同,民主观念及相应的制度建设一直步履维艰。

————————————————

      1997年,我们选出并制定出对12种期刊的分析表格,每位统计员负责一种期刊,要求对各期刊的每一篇文章,如引用的事件、中外人物、中外学说、中外著作等24个项目,并用+,0,-标出文章作者对该事项的正面、中性或负面评价。《新青年》统计由香港的戚立煌先生、吴嘉仪小姐、周成海做出;以下均由复旦大学师生完成:《甲寅》:张谦;《新潮》:孙青;《少年中国》:金燕;《每周评论》:唐云松;《星期评论》:黎建军;《建设》:章红;《努力周报》:赵文斌,《向导》:汪干明;《解放与改造》:楚永全,《醒狮》:苑学武;《现代评论》:孙青和曲伟华。

      需要说明的是,《新青年》与《新青年》(季刊),我们没有作为两个杂志处理,但在图表中,我们将《新青年》(季刊)列入政党或政治团体杂志,因其已成为中国共产主义的理论刊物。

 

中国近现代观念起源研究和数据库方法

 

进一步分析表一,我们还可以看到另一个重要趋势,这就是在新文化运动早期,“民主”这一关键词不仅是正面的,而且使用得相当少。《新青年》各卷“民主”一词使用在价值取向变化同时,不仅意义在变化,使用频度也在不断增加;甚至在最后一卷“民主”(主要是负面使用)超过“科学”(图二)。这说明《新青年》作者群对“民主”一词的意义理解存在着一个从肯定到否定和意义重新界定的过程。只要将所有包含该关键词的例句找出,区分其意义类型,并考察其变化过程,就能揭示该刊中使用民主观念的意义演变以及它与重大社会事件的关系。为此我们系统研究了和民主观念有关的三个关键词“民主”、“民治”、“德谟克拉西”,即将图二民主曲线分解为三条曲线,得到图三。

 

图三中有四条曲线,它们分别是“民主”(曲线B)、“民治”(曲线C)、“德谟克拉西”(曲线D)三个词在《新青年》各卷中出现的频度统计;曲线A则代表民主观念的这三个词汇的三条曲线的总和。图三B表明,1915年至1918年间“民主”一词出现频度不高,它是1919年以后日益普及的。而曲线A表明民主观念演变过程有三个高峰,第一个出现在1917年下半年至1918年上半年。这一时期民主观念主要由“民主”这个关键词表达,包含“民主”关键词的例句分析表明,其意义相对简单,主要是与“君主”对立。曲线A的第二个高峰为1920年初至1922年初,和民主观念有关的关键词主要是“民治”和“民主”。例句分析证明:人们对“民主”的理解主要集中在“民治”、“平等”、“工人政治”等大众参与方面,也就是说这时“民主”除了和“君主”对立外,已具有多重含义。曲线A第三个高峰出现在1924年至1926年,这一时期代表民主观念的关键词主要为“民主”和“德谟克拉西”。关键词例句分析指出,这一时期“民主”的意义和第一第二阶段完全不同,其主要成分为表达无产阶级专政和批判资产阶级民主。只要将图二、三和表一揭示的现象和当时发生的历史事件结合起来考察,就可以理解为什么《新青年》民主观念会呈现出上述三阶段的变化。

 

中国近现代观念起源研究和数据库方法

 

如图二所示,民主观念凸显的第一个高峰之所以在1917年下半年至1918年上半年间,和张勋复辟帝制直接有关。因为这时关键词“民主”的主要意思是指不同于世袭君主制的政治制度,大多为正面引用,表示与“君主”对立。关于被提及事件的数据挖掘证明,袁世凯、张勋先后复辟帝制正是人们常提及的政治事件。当时新知识分子对袁世凯和张勋破坏初建的共和政体极为反感,常常使用与君主立宪相对立的“民主”一词来表达他们的政治理念和对合理政治制度的追求。这一阶段民主理念相对空洞、意义单纯。民主观念凸显的第二个高峰在1919年至1922年间,代表性关键词是“民治”等,意味着对民主观念重构时期的来临。我们还可以看到,当第一次世界大战结束后,新知识分子在质疑西方帝国主义与战争的思想背景下,赋予民主以平等、民治等不同的含义,并开始大争论,故民主观念的意义内涵变得很多元。而到1924年至1926年出现的民主观念凸显的第三个高峰,这时《新青年》已是共产党立场的刊物,通过例句分析可以发现,作为正面的“德谟克拉西”,其意义往往指“民主专政”;而“民主”一词负面评价大大增加,它是针对资产阶级民主及其政党的批判。很明显,这三个阶段正好对应着《新青年》知识群体对民主观念的接受和重塑,刻画了他们在学习西方社会制度时由接受到失望并转向接受马列主义新意识形态的过程。

 

核心期刊快速发表
Copyright@2000-2030 论文期刊网 Corporation All Rights Reserved.
《中华人民共和国信息产业部》备案号:ICP备07016076号;《公安部》备案号:33010402003207
本网站专业、正规提供职称论文发表和写作指导服务,并收录了海量免费论文和数百个经国家新闻出版总署审批过的具有国内统一CN刊号与国际标准ISSN刊号的合作期刊,供诸位正确选择和阅读参考,免费论文版权归原作者所有,谨防侵权。联系邮箱:256081@163.com