刘蓓++任亚波
摘 要:随着网络化和数字化的快速发展,人们对信息的需求已成为生活中不可或缺的一部分,但如何从这繁杂、庞大的资源库中快速搜索和提取对自己有价值的信息就成为广大用户必须面临的问题,而信息检索成为解决这一问题的关键。因此,该文主要围绕信息检索展开讨论,选择以立体印刷技术论文的撰写为例,从课题分析、检索工具的选择、检索关键词的确定、检索过程及结果输出、分析、提炼等方面对文献信息检索技术及其应用进行详细介绍。
关键词:信息检索 信息分析 信息提炼 立体印刷
中图分类号:TM63 文献标识码:A 文章编号:1674-098X(2016)09(c)-0100-02
在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的发布、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。
1 信息检索概述
信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情報科学、人工智能、自然语言处理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。
1.1 信息检索的意义
信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。
1.2 信息检索的四要素
信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。
1.3 检索语言及方法
检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。
信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。
2 信息检索流程
信息检索过程可分为以下步骤:课题的确定——选择合适的数据库——初步拟定检索式检索——调整检索策略(考虑准确性)——命中结果分析——批量下载——信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。
2.1 检索工具选择
对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。
(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。
(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的发布、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。
1 信息检索概述
信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情报科学、人工智能、自然语言处理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。
1.1 信息检索的意义
信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。
1.2 信息检索的四要素
信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。
1.3 检索语言及方法
检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。
信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。
2 信息检索流程
信息检索过程可分为以下步骤:课题的确定——选择合适的数据库——初步拟定检索式检索——调整检索策略(考虑准确性)——命中结果分析——批量下载——信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。
2.1 检索工具选择
对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。
(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。
(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲学、医学、人文社会科学等各个领域。可进行高级、专业、跨库检索以及期刊導航。
(3)中国优秀博硕士论文数据库:目前国内相关资源最完备、连续动态更新的高质量学位论文数据库,包含理工、农业、医药、文史哲、法律、教育与社会科学、电子与信息科学、经济以及专题文献等。
(4)外文文摘数据库:既包含单学科数据库,如CA(化学)、PA(石油)、Georef、Medline等,又包含多学科综合数据库,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。对于国际化的今天,外文检索已成为每个考研人员必备的技能。
(5)其他数据库:Google学术中文和外文搜索、万方、维普、知网、专利检索系统以及标准文献检索数据库等。数据库文件普遍采用CAJ和PDF格式,须下载专门的浏览器来阅读。
2.2 检索词确定
确定中文检索词:设置与论文名字相关的检索词进行检索,如,立体印刷、3D印刷、立体图像、立体印刷品;确定英文检索词:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image
2.3 检索过程及结果分析
利用以上介绍的检索方式以及各个数据库的特点,选用中国知网、Google学术、硕博士论文数据库、EI和专利网,结合设定的检索词进行文献检索,该文例子主要围绕图书、期刊、硕博士论文和专利来搜索。为了便于对文献的管理、引文编排,论文写作采用EndNote插件建立分类文献库。在搜索文献时注意尽可能将时间设定在近5年内,学位论文搜索优先,这样对研究对象的背景、现状首先有大概的了解;其次进行大量其它文献的检索,可以参考论文后的参考文献、某个领域的专家或数据库连接到的相似文献等来扩展检索。无论对于中文还是外文的搜索,不能盲目下载,必须注意文章摘要与目标对象是否有关,否则会加大有用文章筛选的工作量。
检索到的文章由于存在相似性,一定要做好分类,方便快速查找。总的来看立体印刷技术相关文献主要涉及人眼视觉理论、光栅成像、立体图像制作、光栅材料及使用、立体印刷产品质量评价和市场分析、立体印刷工艺研究以及相关设备制造等。通过以上文章的搜索我们可以对立体印刷有大致的了解,对于写综述性的论文可以按照以上点来设置章节标题,如果要进行某一点的深入研究,需要认真研读,将文章的各个点吃透,或进一步查阅相关资料。总之,文献检索不能盲目,初步检索分析后,再次具有针对性性的进行检索。
3 结语
该文围绕信息检索技术展开讨论,首先,简单的介绍了信息检索的含义、目的、意义、检索要素和方法等,让大家对此有直观的认识。其次,结合立体印刷技术综述报告的例子,详细的阐述了文献的查找渠道、提炼、分析和总结过程,对以后工作和学习中有效的进行信息检索具有一定的参考价值。
参考文献
[1]刘双魁.信息检索与利用[M].上海:东南大学出版社,2010:8.
[2]祁延莉.信息检索概论[M].北京:北京大学出版社,2013:7.
[3]张金松.基于引文上下文分析的文献检索技术研究[D].大连:大连海事大学,2013:4.