刘淑丽
摘 要:高校的教职工和在校学生是高校图书馆的主要服务对象,教师需要在图书馆中查寻有价值的资料,并结合实际运用在教学中。学生通过高校图书馆查阅大量资料,拓宽自己的视野,丰富自己的知识。大数据时代的到来,带来了许多新的变革。因此,许多行业都呈现了新的业态,大数据在高校图书馆的运用,提高了管理的效率,也使得高校的图书馆里工作变得更加的方便快捷。其中高校图书馆的图书管理更是受到了很大的影响, 由此开始由传统的管理方式向信息化的方向转变, 在管理模式上也有较大的创新。
关键词:大数据 图书管理 信息化
1 大数据背景高校图书馆图书管理信息化的意义
在原有的高校图书馆管理体系中,教职工和学生如果有信息资料的需求,需要用传统的方法在大量的图书资料中查找,既费时又费力,还不容易找到合适的资源,信息化时代信息类型多样,具备各自的应用价值,大数据时代的到来,高校图书馆创新图书管理模式。建立专门的信息检索渠道,提高了文献资料的查找的效率[1]。
除此之外,以往的图书馆管理工作中的,对资料文献的采购环节也是图书馆工作中的难题。由于信息的不对称,采购的图书资料一定程度上并不使用具体的需要。电影方面采购的效率也受到影响,有可能在这个过程中会发生图书损坏现象。在大数据时代背景下[2],使用大数据技术体系实现高校图书馆图书管理信息化能够深入挖掘有效信息,满足师生的实际资源需求,不仅使服务面大大拓宽,而且学生获取知识的渠道也更加广泛。
2 研究内容
2.1 数据分析
借助ETL将职工和学生借阅图书的相关历史数据进行处理,将处理转换出的数据作为数据挖掘的数据源,并对读者借阅图书的详细信息和历史记录进行数据分析。
2.2 数据挖掘
在数据挖掘算法的选择上,最终选择了聚类算法中的K-Means算法,通过对历史数据进行分析以期将读者划分为若干个相似的读者群,在读者群内运用关联规则算法中的APRIORI算法对数据进行挖掘,最后将挖掘结果作为个性化推荐的源数据。
2.3 图书推荐系统
对职工和学生借阅图书的相关历史数据和对历史数据进行数据挖掘产生的数据通过推荐算法实现用户登陆图书借阅系统后根据相关规则自动化与智能化推荐书籍的功能。
3 数据分析
3.1 数据分析概述
数据分析是指采用适当的统计分析方法对大量数据进行分析,提取出其中有用的信息并且形成结论的过程。在现实生活中,数据分析可帮助人们做出判断,以便采取适当行动。
3.2 数据分析划分
对数据分析可以归纳3个类别,分别是:描述性数据分析、探索性数据分析以及验证性数据分析。其中描述性数据分析为初级数据分析,其他2种数据分析方法相对高级。探索性分析重点在于数据当中发现新的特征。而验证性数据分析重点在于验证已有假设真伪证明。其中描述性数据分析为我们工作中经常应用到的数据分析方法。
3.3 数据分析作用
数据分析是为了最大化地开发数据和发挥数据的作用。把隐藏在其中的一大批信息集中和提炼出来,总结出内在规律。在商业领域中,数据分析能够帮助企业进行判断和决策。
3.4 圖书管理中的数据分析
(1)将编目信息输入数据库用例的时序分析。
首先对图书进行扫描分析,根据高校的要求将图书进行整理与归类,以便完成图书的检索功能。通过对所有图书的检索数据进行处理分析,并把这些数据关联结合起来生成其他数据信息,有效地解决日常检索中的常见问题,最大限度地将信息进行归类、整理和储存。
(2)图书卡发放回收的时序分析。
因为每年都会有高校新生的到来和毕业生的离去。图书馆的读者信息在一个动态变化状态,通过对借阅数据的处理分析、可以动态地滤除过期的读者信息,并增加新的借阅信息。
4 数据挖掘
4.1 数据挖掘概述
数据挖掘一般指从大量数据中自动搜索出隐藏其中的特殊关系型信息的过程,数据挖掘在技术上的定义是指从有噪声的、大量的、随机的和不完全的数据中提取出隐含在其中的、事先并不知道的但又有潜在的有用信息和知识的过程。数据挖掘目前是人工智能和数据库领域研究的热点问题,主要基于人工智能、机器学习、统计学、数据库、可视化技术等。
4.2 数据挖掘过程
数据挖掘首先需要从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集,然后用某种方法从大量数据中将数据集所隐含的规律找出来,最终以用户可以理解方式展现出来,比如可视化和报表[3]。
4.3 数据挖掘主要算法
数据挖掘的算法主要分为6类,分别为分类分析、聚类分析、关联分析、时间序列分析、预测分析和偏差分析。
算法中的分类算法应用是将事先已经存在的数据进行建模,然后对新的数据进行分类,而聚类算法则并不存在已知结果,而是从大量数据中挖掘它们的共性,将大量数据聚类到集中类别。
4.4 图书管理中的数据挖掘
4.4.1 借阅行为模式与读者群分析
(1)孤立点分析。对读者群进行分析,分析的主要依据来源于读者的以往借阅习惯,通过以往历史数据的核查,从而推荐可能受欢迎的图书。
(2)聚类统计。结合读者借阅记录以及读者的群体性特征,通过聚类算法对数据进行挖掘从而获得读者的行为规则。
4.4.2 个性化服务工作
(1)关联规则分析。借助读者的借阅记录数据以及借阅图书数据之间的关联关系进行分析,从而推算读者的具体需要以便为不同群体读者提供各自需求的服务。
(2)时间序列分析。通过分析读者的借阅时间数据和借阅顺序数据,分析读者的借阅习惯,以便为读者推荐合适类型的图书。
4.4.3 文献排架管理方面
借助数据挖掘技术对所有借阅历史记录数据进行处理分析,得出一个在馆图书的受欢迎程度、读者群体的阅读习惯和图书借阅类型的分析结果。这有利于图书资源的合理调配,提升了在馆图书的利用率[4]。
5 个性化推荐系统
5.1 个性化推荐系统概述
推荐系统通过发掘用户的行为数据,得到用户潜在的个性化需求,从而将物品准确推荐给需要它的用户,帮助用户找到他们感兴趣但很难发现的物品。高质量的推荐系统能够使用户对系统产生依赖,因此,推荐系统不仅能为用户提供个性化服务,还能与用户建立长期稳定的关系,提高用户忠诚度并防止用户流失。系统总体设计如图1所示。
5.2 推荐系统一般构建过程
(1)通过用户行为数据建立用户模型。
(2)通过物品的基本信息数据建立推荐对象模型。
(3)通过用户兴趣匹配物品的特征信息数据,再经过推荐算法计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。
5.3 推荐系统主要算法分类
推荐的算法可以分为两个类别:第一个类别是基于物品的推荐算法,依靠的是基于用户得对A较感兴趣,然后推荐A以及和A相关的B物品。第二个类别是基于用户的推荐算法。依靠的是为用户推荐和他兴趣相近的其他用户选择。
5.4 图书管理中的个性化推荐
基于借阅图书人员行为的协同过滤,首先根据搜索的关键词和历史借阅数据等做推荐,然后考察是否满足实际用户的需求,再对推荐列表进行动态更新;基于社交关系的推荐主要侧重于其相同或者相似专业的读者具有什么读书爱好,据此对推荐列表进行更新[5]。
6 结语
图书馆在任何一所高校都具有非同寻常的意义,具有不可小觑的作用,最重要的是其馆藏资源对于师生提供了重要的知识支撑。目前图书馆大多数仍旧处于落后的传统管理系统,并不能有效地针对每个用户提供个性的服务。并且,随着图书资源数量的急剧增加和知识更新速度的不断加快,如何对图书馆产生的历史数据进行有效的处理分析、如何让准确高效地向读者提供所需要的图书,也是图书馆无法避免也应当积极去做的事情。
参考文献
[1] 孫军艳,张博,陈智瑞,等.基于数据挖掘的图书管理系统分析与应用[J].智库时代,2019(22):113-114.
[2] 张力鹏.基于用户兴趣变化的高校图书馆个性化图书推荐技术的研究与实现[D].辽宁大学,2017.
[3] 管巧珍.浅谈数据挖掘的图书馆个性化推荐系统研究及应用[J].才智,2018(20):225.
[4] 李娟.高校图书馆信息管理系统分析[J].当代教育实践与教学研究,2018(7):93-94.
[5] 李会艳.数据挖掘技术在高职院校图书管理中的应用[J].农业图书情报学刊,2015,27(3):65-68.