周聪 张德林 尹志强
DOI:10.16661/j.cnki.1672-3791.2108-5042-6931
摘 要:机构知识库收录该机构各种类型数据资源,大数据时代,随着机构知识库联盟的建立,其资源内容更加丰富。该文分析了机构知识库为科研服务的优势,利用其资源、人力、技术、平台优势,为机构的科学研究提供了更加深入的服务。该文还通过网络调查法,调查了机构知识库的服务现状,提出了学科馆员可以利用机构知识库对机构资源进行保存、为科研人员提供查收查引服务、分析科研数据、进行用户画像、与其他机构进行横向对标分析,以更好地服务于科学研究。
关键词:机构知识库 IR 科研服务 机构知识库联盟
中图分类号:G250 文献标识码:A文章编号:1672-3791(2021)06(b) -0150-04
Research on the Role of Institutional Repository in Scientific Research Service
ZHOU Cong1 ZHANG Delin2 YIN Zhiqiang1
(1.Library of Xuzhou Medical University, Xuzhou, Jiangsu Province, 221004 China; 2.The Affiliated Hospital of Xuzhou Medical University, Xuzhou, Jiangsu Province, 221000 China)
Abstract: Institutional repository contains various types of data resources of the organization. In the era of big data, with the establishment of Institutional Repository Alliance, its resource content is more abundant. This paper analyzes the advantages of institutional repository in serving scientific research, and uses its resources, manpower, technology and platform advantages to provide more in-depth services for institutional scientific research. the paper also through the network survey method, this paper investigates the service status of institutional repository, and puts forward that subject librarians can use institutional repository to save institutional resources, provide retrieval and citation services for scientific researchers, analyze scientific research data, conduct user portrait, and conduct horizontal benchmarking analysis with other institutions, so as to better serve scientific research.
Key Words: Institutional repository; IR; Scientific research service; Institutional Repository Alliance
机构知识库(Institutional Repository,IR)作为开放存取的一种很重要的形式,能够对该机构的科研成果进行保存,提供给学者,对其资源免费利用,以达到资源保存、扩大本机构和学者的学术影响力的目的。但是,早在2010年斯坦福大学图书馆的T.Cramer就提出,传统意义上局限于机构内成果的展示、收集、存贮功能的机构知识库建设,即将濒于死亡。IR作为社会发展的产物,要随着社会的发展而发展。IR收录该机构各种形式的科研成果,为学科分析、绩效评价、查收查引等服务提供数据基础。同时,建設IR的各机构,在选用平台时,选取了可扩展性平台,为IR扩展服务内容奠定了平台基础。利用机构知识库的资源优势、人力优势、技术优势、平台优势,开展科学研究服务,使孤立的IR资源活起来,通过对信息资源的收集、整理、分析、统计、评价、挖掘等,为科研活动的整个生命周期提供数据支持,为决策者的科研决策提供数据支撑,提高IR的服务能力,提高其影响力,促进其可持续发展。
1 机构知识库科研服务的优势
1.1 IR的资源收藏为科研服务提供了数据基础
机构知识库收录该机构各种类型的资源,在收录过程中,要兼顾资源的数量和质量。通过IR对科学研究进行服务,可以直接检索、使用科研数据,避免重复劳动。同时,可以对该机构科研成果进行统计、分析、可视化展示,为机构领导科研决策提供数据支持。截至2021年5月13日,中国科学院机构知识库网格收录期刊论文787 540条、会议论文131 949条、其他112 291条、专利99 230条、学位论文96 155条、获奖成果5 725条、专著5 489条、演示报告1 374条、研究报告1 199条、文集805条。这些信息资源规范、全面,并且经过系统地整理、归类,通过多角度进行展示,方便学科馆员、科研人员、科研决策者对其进行使用,为科研服务奠定了数据基础。
1.2 IR联盟的建立为科学研究提供了更丰富的数据支撑
机构知识库联盟的建设至今已有二十多年,其建立可以解决单个机构知识库在建立过程中的经费问题、技术问题、规范问题等。该文采用如下对机构知识库联盟(以下简称“联盟”)的定义,认为机构知识库联盟是多所高校、研究机构通过合作的方式,整合各成员的知识资源,统一提供数字化服务的机构知识库群[1]。国外联盟主要有国家层面和区域层面的联盟;我国联盟主要是机构间IR联盟、学科机构知识库联盟、区域机构知识库联盟等[2]。代表性的联盟有中国高校机构知识库联盟、中国科学院机构知识库网格、农科院机构知识库、药学学科知识库联盟、海南省高校机构知识库联盟、重庆区域高校机构知识库等。机构间联盟可以促进各机构之间更为广泛的资源共享,集合各机构的技术优势,建立功能全面的联盟平台。学科机构知识库联盟,集本学科知识于一体。首先,通过联盟平台,对该学科资源进行分析、挖掘,为科研工作者提供该学科的可视化的知识图谱;其次,科研工作者通过平台对资源内容的多角度展示,可以寻找合适的合作伙伴;最后,学科IR联盟,可以吸引相关企业加入,促进科研知识转化。区域机构知识库联盟可以促进区域的科研合作、发展。IR联盟资源更加丰富,技术更加完善,建设规范更加标准,对IR建设起到促进作用,联盟的建设可以起到1+1>2的效果。
1.3 IR建设者有丰富的学科服务经验
IR的建设者主要为图书馆馆员。图书馆馆员负责机构的科研支持服务工作,查新、查重、查收查引、学科数据统计、学科分析报告的撰写等。他们了解科研人员的科研需求,有丰富的学科服务经验。在IR建设及运行过程中,可以收集、整理科研人员的需求,使IR建设更贴合用户需求。面对科研人员查收查引提交数据的准确性问题、科研绩效评价问题、领导者的科研决策问题等,IR平台可以利用自身独特的机构知识资源服务功能,为用户提供服务[3]。
1.4 IR平台的可扩展性为丰富科研服务提供了可能
在信息社会,技术发展越来越快,用户信息需求也在发生变化,资源检索与保存已经不能完全满足用户需要。对信息资源进行分析、挖掘、可视化展示,为用户提供精准的数据服务,才能满足现阶段用户的个性化需求[4]。任何平台的构建都要遵循可扩展性原则,才可以与时俱进,不断满足人类日益变化的信息需要。中国科学院机构知识库采用Cspace管理平台。Cspace知识管理软件系统经过十几年的开发、扩展,已经从知识资产存储发展到支撑科技决策阶段。Dspace平台、Cspace平台、CNKI等机构知识库平台,都支持自定义选择设置和新模块的开发,以适应社会发展对平台提出的新要求。
2 机构知识库科研服务现状
2.1 科研数据保存、开放获取
现阶段,IR平台都提供对科研数据的长期保存服务,并且对所保存资源实行开放获取[5]。北京大学机构知识库(简称PKUIR)作为支撑北京大学学术研究的基础设施,收集并保存北京大学教师和科研人员的学术与智力成果;为北京大学教师、科研人员和学生的学术研究和学术交流提供系列服务,包括存档、管理、发布、检索和开放共享等。大连理工大学机构知识库以知识管理与学术交流为目标,收集、组织、管理、保存、传播教职工的学术研究成果,全面展示其学术科研水平,实现知识传播与共享。机构知识库中拥有期刊论文、会议论文、学位论文、专利、著作、报纸、标准等多种类型学术成果。IR平台的资源主要来自建设者利用爬虫技术的自动收割、科研人员的自动提交、认领、管理员提交等。各机构知识库收录多种类型的科研成果,经网络调查,数量最大的为期刊论文,其他还有学位论文、会议论文、科研项目、专利等多种类型,同时IR平台也越来越重视灰色文献的收集,资源内容更加丰富。
2.2 科研成果分面揭示
IR平台对保存内容进行多角度的分面揭示。中国科学院机构知识库网格通过机构、采集方式、内容类型、发表日期、学科主题等方面,对资源进行揭示;北京大学机构知识库能够通过作者、关键词、发表期刊、发表日期、收录数据库、ISSN、文献类型、语言等方面,对文献进行浏览、检索。通过分面揭示,使科研工作者、科研决策者,对该机构科研成果有更加明确、整体的了解。
2.3 科研成果的统计、分析
IR对科研成果进行收集,通过IR平台对其进行统计、分析,以数字或者可视化的方式展现出来。数量汇总统计主要有成果总量、全文成果量、全文开放量、浏览量、下载量、篇均下载量、学者数等。另外,还可以对数量进行多角度揭示,比如按照地区、日期、主题、作者、机构、类型等。在对成果多角度统计的基础上,对其进行数量分析、趋势分析。包括机構排行、成果类型排行、收录类型排行、时间数量排行、浏览排行、下载排行、引用排行、存缴趋势分析、访问利用趋势分析等。大连理工大学机构知识库用可视化图表展示成果趋势、各院系成果统计、访问趋势、论文收录类型分布,有折线图和柱形图两种,通过图形展示,科研人员和机构决策者能够对该机构科研情况有更加形象的认识。
2.4 科研评价指标
中科院机构知识库的科研评价主要有:科研产出能力评价、科研论文生产力评价、科研论文影响力评价和机构对比分析评价。具体指标如图1所示。
由图1可知,中科院重视机构科研成果评价。科研产出能力通过期刊论文数、SCI收录、EI收录等数量来表现;科研论文生产力通过国际论文数、第一作者论文数、基金论文数等来体现;科研论文影响力通过被引次数、高被引论文数、机构H指数等体现;通过产出能力、论文生产力、论文影响力等来对机构进行对比分析。这些指标全面展示了机构的科研能力。
IR在建设者的努力下,具有多项功能,收集、保存资源、多角度展示信息内容、对资源进行统计、分析,甚至对所含内容进行多指标评价,丰富了IR服务内容。随着IR平台的扩展,还可以对IR资源进行内容的揭示,从数量+主题的角度,分析数据,更加全面展示机构科研成果。
3 机构知识库对科学研究的作用
3.1 资源的安全、规范保存
科研数据的保存,是IR的基本功能。IR要收录各种类型的科研资源,为科研工作者提供长期地、安全地保存服务。经有些研究者调查,数据安全问题是科研工作者最先关注的问题,他们担心数据被不正当利用,担心数据安全无法得到保证,所以IR建设者要利用政策约束、网络安全技术等,保障资源的安全性,使其资源得到规范利用、共享,这样才能调动广大科研人员的积极性,激发科研人员提交、认领成果的积极性,最终收集更多高质量的数据资源,供科研人员使用[6]。其次,数据保存规范,也是保障科研工作者顺利使用IR的标准之一。2017年10月29日,CHAIR元数据标准建设讨论会在北京大学召开。CHAIR秘书处、清华大学图书馆、上海交通大学图书馆、武汉大学图书馆、中科院文献情报中心及中科院兰州文献情报中心的代表主要围绕CHAIR与中科院兰州文献情报中心战略合作、机构知识库元数据规范、机构知识库建设指南等问题进行了讨论。2018年4月8日,由上海交通大学图书馆牵头,已完成期刊论文、会议论文、图书资源、学者元数据、机构元数据、期刊元数据六类元素集。IR机构及联盟,在数据的安全、规范方面,都做了相关规定,保证其数据安全、规范发展。
3.2 查收、查引服务
查收、查引服务是学科服务的一项基本内容,需要科研人员向学科馆员提交相应的文献信息,题名、责任者、发表时间、出版物名称等。提交信息可以手动填写清单,或者按格式导入文献信息。手动填写清单,容易出错,且比较繁琐;导入文献,需要提交者在数据库里检索、下载相应的格式,再进行提交。通过IR系统提交,以作者名称检索,检索查准率高,中外文文献同时检出,文献数据准确。把IR平台与查收查引系统对接,或者IR平台与数据库对接,开发查收、查引功能,节省学者提交文献时间,只要IR平台收录学者信息齐全、文献数据准确,就可以快速、准确地完成文献的查收、查引工作。
3.3 数据分析服务
IR为机构科学研究服务,为科研决策者提供决策支持,需要对IR资源数据进行分析。Cspace平台、维普机构知识库平台、CNKI机构知识库平台等都开发了基于机构数据的分析功能。现阶段,数据分析主要有数量统计分析、排行分析统计、趋势分析等。学科馆员要根据科研工作者不同时期的科研需求、决策者的决策需求,不断调查分析内容、更新分析指标,为其提供个性化的服务。在数量分析的基础上,IR平臺可以嵌入主题分析软件,加入主题、关键词分析等功能,比如:Citespace、SPSS等,从数量和内容方面,反映机构科研成果,全面展示机构科研成果。
3.4 用户画像
大数据时代,信息资源暴增,为用户的使用提供了数据基础。但是,如何利用先进的信息技术,为用户提供适合的信息资源,实现精准推荐,是学科馆员的任务之一。用户画像是大数据环境下理解目标用户、具化用户形象、明确服务目标的一项应用工具,实现了用户、资源、服务以数据为中介的交互。它可以通过挖掘用户行为痕迹中的隐藏数据,从而发现用户的信息需求,有效链接服务和用户诉求。学科馆员通过IR平台,与其它数据库进行连接,利用信息收集、整理、分类、分析、挖掘等技术,提取用户标签,为用户画像,做到深入了解用户,从而为其提供精准服务。
3.5 对标分析
IR的资源保存功能、统计分析功能、科研评价功能等,为机构进行对标分析提供了基础,其收录内容全面,资源类型多样,语种多样,为横向的机构对标分析提供了便利。商业数据库包括中文数据库、外文数据库,在科研成果的对标分析中,不能做到同时对中外文文献进行分析。通过IR,能够对各机构中外文文献同时对标。对其发文量、发文主题、文章被引、文献增长趋势等多方面对标分析,可以全方面了解本机构科研水平、寻找合作者或合作机构。中科院机构知识库对其系统内部各机构之间进行对标分析。经过张伶等人对我国科研机构和高校机构知识库的调查,截至2019年11月,我国共有IR325个。随着联盟的建立,IR建设机构的增多,各机构可以选择相应的机构进行对标,横向了解本机构科研状况。
4 结语
IR收录本机构的知识成果,能够对本机构的科研成果进行全面的展示。要利用IR收录的资源优势、强大的平台功能,为机构的科研工作、决策者的科研决策提供全面的、个性化的服务。发挥IR功能,更好地服务于科研,促进IR的可持续发展。
参考文献
[1] 范文静.我国高校机构知识库的服务功能研究[D].昆明:云南大学,2018.
[2] 苏庆收.高校机构知识库学科服务创新研究[D].淄博:山东理工大学,2019.
[3] 张宇,刘文云.基于数据生命周期的高校机构知识库科研数据服务研究[J].图书馆学研究,2021(3):71-80.
[4] 曾华明.基于开放获取的高校科研成果知识库构建研究[J].情报探索,2021(1):79-84.
[5] 周聪,张德林,尹志强.基于“人”的机构知识库可持续发展策略研究[J].图书情报导刊,2021,6(4):31-37.
[6] 王伟.基于关联数据的新一代机构知识库知识发现系统研究[J].图书馆学刊,2020,42(11):72-75.
基金项目:江苏高校哲学社会科学研究项目《大数据环境下高等医学院校图书馆科研服务平台研究》(项目编号:2019SJA0949)。
作者简介:周聪(1983—),女,本科,馆员,研究方向为科研服务。
张德林(1983—),男,本科,高级工程师,研究方向为大数据、人工智能。
尹志强(1983—),男,硕士,馆员,研究方向为智慧图书馆。