张仁竞
摘 要:文章依托CNKI数据平台,筛选条件为“鲁迅及其作品研究”,选取1976年至2017年5月20日前上传到CNKI数据库中的数据,共计18733条。运用文献计量学统计方法,对数据进行筛选、整理、分析,得出结论如下:一,近5年来论文质量和数量发生背离;二,研究资源高度集中,地区分配不均衡,发展不平衡;三,国家支持力度逐步加大;四,研究热点趋于分散,边缘化课题逐渐浮出,跨学科研究获得重视;五,影响力显著的学者数量较少。作为一种新的研究思路,希望“关键词”研究能为鲁迅研究的进一步展开提供帮助。
关键词:大数据 文献计量法 鲁迅研究 焦点转换 研究取向
一、引言
迄今为止,对论文“关键词”等数据的提取、分析与整理,在文学领域还未真正展开。以鲁迅研究为例,一般文学研究者对研究热点和趋势的把握,除了长期大量阅读之外,主要依靠领域内专家学者的直觉判断和学术经验,他们没有话语权或很少话语权,只能亦步亦趋跟在别人后面搞研究,形成一个热点兴起无数人跟风而上的状况,造成大量的资源浪费,学术垃圾也就此产生。如近期发表的《〈呐喊〉版本新考》的版本研究是不是一种新的学术动向?{1}《烦扰境遇中坚确践行的念想与历史关涉的审慎:也论〈理水〉》对鲁迅思想的研究进行到何种程度?{2}《阿Q、汉字与文化认同》作品细读的方向在哪里?{3}《论鲁迅的负面女性形象书写》作品人物研究过时了吗?{4}《竹内好的“现代”话语——从子安宣邦〈何谓“现代的超克”〉讲起》国外研究者关注的热点是什么?{5}《服饰变迁与政治、文化转型——鲁迅小说服饰描写的时代性、文化性与思想性》跨学科研究究竟有多大可能?{6}李国华在总结新世纪以来鲁迅杂文研究的得失时说:“遗憾的是,有的研究者对于自身研究范式和所采用的知识基础缺乏必要的反思,故而生产出了一些事与愿违的学术产品。”{7}那么,问题是研究者自身研究范式和知识基础的反思的动力和资源来自于何方?如何从鲁迅研究的浩渺论文之海中把握研究方向?没有数据分析与推演,凭借经验与阅读显然不是一个好的办法。笔者尝试用质性分析和量化分析的方法和技术对近四十年来鲁迅研究取向、发展趋势及焦点转换进行分析和评价,为鲁迅研究者提供参考,探索一种新的文献分析方式和思维方式。
二、收集数据的说明
1.依托CNKI数据平台,筛选条件为“鲁迅及其作品研究”,学科限定在“哲学和人文社会科学”下的“中国文学”,检索年限设定为“1976年1月1日至2017年5月20日”。鉴于数据上传的时效性较强,本次论文分析所收集的数据截止到2017年5月20日,即在2017年5月20日之前上传到CNKI数据库中的1976年至2017年5月20日的数据。内容包括作者,论文题目,关键词,发表期刊,发表时间,作者单位,基金项目来源,学科类别,被引次数等。通过条件限定筛选,最终输出有效数据共计18733条。
2.数据分析。内容:作者相关信息(单位、论文篇数),论文发表情况(数量、发表时间、资金来源、关键词、学科分类),发表期刊(类别、内容),论文作者影响力及H指数;方法:运用文献计量学统计方法和图书情报分析系统。
三、结果与分析
1.发文趋势及期刊来源分析。从1976年开始,鲁迅研究一直处于稳定增长状态。1981年、1986年、1996年、2006年、2012年五个年份论文发表数量激增。2012年后,数量出现下降态势,并逐渐退到2000年左右的水平。在总体趋势稳定的情况下,1976—2006核心期刊发表的论文数量与总发表论文数量呈现正比关系。总体数量保持正增长的前提下,实现了质量的稳步提升。2006—2012年间,鲁迅研究论文的数量虽然在增加,但核心期刊数量减少。
2.鲁迅研究项目资助情况。国家基金项目与市级基金项目是论文发表的主要资金来源。第一,总体上,国家项目与市级项目基本持平,市级稍微占上风。在论文资助资金分布上,市级项目资助的论文数量显著高于国家级项目资助的论文数量,表明市一级单位对鲁迅研究课题的认可度较大。国家项目、省级项目、市级项目三者呈现两头大中间小的格局。第二,核心期刊对基金项目的偏好。数据显示,项目共资助446篇论文的发表,发表在核心期刊上的论文有262篇,接近60%;市级项目资助的论文在核心期刊发表的机率更是高达74.4%。论文有项目资助的情况下,发表在核心期刊上的机率是55.10%,优于无项目资助的论文。第三,值得注意的是,在所有论文中,享受基金资助待遇的只占所有论文总数的6.43%;在核心期刊发表的占比更低,仅有3.54%。即使核心期刊偏爱基金资助论文,但也只是占其刊登全部论文的11.70%。四,国家社科基金、博士后科研基金发表论文数量占据优势,地方资助较多的省份有湖南、浙江、辽宁、江苏、上海、陕西、河南等。
3.研究热点分析。笔者采用了论文关键词词频统计的方法来分析和研判近年来鲁迅研究的热点问题。1992—2017核心论文关键词词频前10名排行:鲁迅997,鲁迅研究727,《狂人日记》721,《鲁迅全集》681,鲁迅思想610,《野草》566,鲁迅精神553,鲁迅作品493,许广平447,鲁迅小说422。涉及多个领域,主要集中于:鲁迅的综合研究;鲁迅作品研究;与鲁迅相关的亲人、师友等,如許广平;学科发展,如现代文学、中国现代文学史、语法化问题等;还有一些新兴的、边缘化的、跨学科的数据,如预测模型、文体学、人力资本、语言问题、医学等相关词汇;与鲁迅相关的横向比较,如比较文学对鲁迅的关注,鲁迅与传统文学、世界文学的关系及其贡献,等等。鲁迅及周边研究几乎涵盖了与鲁迅有关的所有学科,挖掘新课题的难度变得越来越困难。
4.影响力分析。影响力分析主要是通过计算H指数。H指数的计算方法的筛选条件为:学科=“鲁迅及其作品研究”,时间=“1976-2017.5.20”,输出结果按被引次数排序,取前50名,然后排序每位作者所有文章和有关鲁迅研究的文章的被引次数,然后取作者第N篇文章被引N次以上的值。H指数的意思是某作者在某段时间内发表的N篇文章至少被引用了N次。H指数是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平。在某一时间内,作者的指数值越大,说明其产出数量与水平越高。在鲁迅研究领域内,H指数排名在最前的十位学者有,钱理群13,汪卫东10,王富仁10,郜元宝7,汪晖7,孙郁7,孙玉石7,李新宇7,张福贵6,谭桂林6。数据显示,这十位学者是鲁迅研究领域最有影响力的专家。
四、结论
第一,近5年来论文质量和数量发生背离,《鲁迅研究月刊》对鲁迅研究贡献巨大,压力也会最大。在上文的分析中已经提到,2006—2012年总论文曲线与核心论文曲线发生了背离,且幅度逐渐拉大。
第二,研究资源的高度集中,各研究机构独立性强,跨区域合作较少。研究资源地区分配不均衡,发展不平衡,资源高度集中。“985”院校、“211”院校、军校、国家机关、国家科研院所占据了大部分的项目名额。北京、上海、江苏、浙江、湖北、湖南、山东等高等教育较发達的城市在国家基金项目分配中占据优势地位。如在2016年公布的国家社科基金项目北京、江苏、上海分别获得项目364项、256项、191项,占总项目数28.4%,将近三成。北京、上海、江苏、浙江、湖北、湖南、山东七地项目占部项目数量的48.35%,接近一半。经济发达的省份基金项目比中西部要多,如上海、江苏、浙江、湖南等地都设有本地的项目基金。各级院校独立意识强,社会科学学科壁垒明显,明显没有自然科学学科合作意识强,加之地方政府区域保护严重,鲜见跨区域合作。
第三,国家对鲁迅研究的支持力度逐步加大。各类基金项目资助的论文发表时处于一种优势地位,且在受资助的论文中,国家级基金项目资助的论文发表在核心期刊上的机率较大。受基金项目资助的级别是核心期刊录用考查的一项重要指标内容。从受各级别基金资助发表的论文数量的增长看,国家及省市对鲁迅研究项目的支持力度迅速扩大,从1999年以前的零资助,到2013年前后达到高峰,相比研究的成果数量,受资助比例仍相对较低。
第四,研究热点趋于分散,边缘化课题逐渐浮出,跨学科研究获得重视。研究热点从集中向分散发展,从前期的鲁迅思想、精神、综合研究转向鲁迅研究领域的散点研究,如精神胜利法、偏至论、破恶声论,虽同为鲁迅研究范畴,但角度和思考方式有了转变,到最近出现的人力资本、预测模式、疾病等相关学科的出现,或许这些方面暗示鲁迅研究领域出现了一些新的动向。
第五,影响力显著学者数量较少,研究领域渐渐分散。文学和文字学独领风骚,面临老调重弹的困境。影响力大的学者多分布于著名院校,且数量较少,不利于学科的发展,会造成学术垄断,造就学术偶像,不利于争鸣的展开。研究领域的分散是近年研究的趋势,原因在于鲁迅研究以往课题思路过于单一,选题类型同质化现象严重。
{1} 陈子善:《〈呐喊〉版本新考》,《中国现代文学研究丛刊》2017年第8期。
{2} 龙永干:《烦扰境遇中坚确践行的念想与历史关涉的审慎:也论〈理水〉》,《鲁迅研究月刊》2017年第7期。
{3} 骆冬青:《阿Q、汉字与文化认同》,《文艺争鸣》2017年第9期。
{4} 罗执延:《论鲁迅的负面女性形象书写》,《中国文学研究》2017年第2期。
{5} 董炳月:《竹内好的“现代”话语——从子安宣邦〈何谓“现代的超克”〉讲起》,《文艺研究》2017年第8期。
{6} 张慎:《服饰变迁与政治、文化转型——鲁迅小说服饰描写的时代性、文化性与思想性》,《社会科学论坛》2017年第1期。
{7} 李国华:《新世纪以来鲁迅杂文研究之得失》,《中国社会科学评介》2017年第2期。