宁莉莉
摘 要:无论在互联网上还是在各高校内部都运行着相应的论文管理信息系统,也能够满足论文的检索查询和管理工作。但是在这些基本的简单信息管理功能的基础上,对于论文这样的特殊信息的管理还有着可以进一步深入挖掘的潜力和需求。首先是对于目前已经存在的浩如烟海的论文有着进行分类管理、查询比对以及深入的内容挖掘分析的需求,而同时现有的无论是公开的还是学校内部的论文所提供的数据,完全可以进行大数据分析,以发掘出隐藏在论文内部更加深层次的结构和关系,为学生和研究人员确定研究方向、撰写论文等工作提供更加有用的信息。
关键词:论文管理 内容检索 数据挖掘
根据该研究的思路,在研究相关的数据分析和系统实现技术前,首先需要设计出论文管理信息系统所具备的最基本的功能,定义系统所能够提供的论文管理服务。在这个基础上才能够为后续的技术研究设定目标。
1 体系结构设计
该系统的体系结构采用标准的4层B/S信息管理系统模型,即客户端、Web服务层、业务层、数据库服务层。这也是目前所有互联网应用的基本结构。该系统为了研究和讨论方便,将采用比较流行的Django框架进行设计,Django框架将主要解决Web服务层与业务层的大部分问题,客户端将使用jQuery框架来实现。系统的架构完全可以基于已有的成熟开源框架,因此相对的设计十分简单,研究的重点是系统功能的设计、论文信息的收集、数据的分析以及统计算法等技术。
对于系统功能的设计将主要包含两部分内容:系统功能和数据库结构。另外为了在系统中增加更加容易使用的接口,将在最后设计相关的公共访问API接口。下面将描述系统的主要功能设计。
1.1 公有云平台安全管理
在设计系统其他功能前,首先需要研究的是公有云平台的安全与信任管理问题。云中的服务器可以是物理机器,也可以是虚拟机。但是该系统所使用的是公有云服务所提供的请求服务接口,并通过该接口完成从云中将虚拟系统抽取出来满足请求。因此,在公有云平台安全方面主要是考虑虚拟机的安全问题(云平台安全管理模型如图1所示)。根据云平台的结构,以及该系统的特点,公有云平台至少需要提供如下特殊安全保护云组件(见图1)。
1.2 用户管理
用户管理功能为系统提供用户的身份验证的功能,同时为系统的用户身份分类、论文分类管理以及学术圈组成等其他功能实现所需要的基本信息。用户管理功能包括了用户身份注册、密码管理和登录验证。所有用户的相关信息存储在数据库中,通过用户管理服务进行使用。基本的用户管理功能相对比较简单,数据库结构的设计也相对容易,用户管理功能与论文的信息基本无关,但是与整个系统的正常运作,以及学术圈的建立有紧密的关系。
1.3 论文编写工具
论文编写工具是在论文管理功能的基础上,为研究人员提供一个更加方便的论文编写工具。能够帮助用户编写格式满足要求的论文,能够方便在研究人员之间及时地对论文的某一部分进行讨论或评论,进而更加有效地形成相关研究论文。论文的编写功能还包括了创建、编辑等基本功能,但这些功能都是软件开发的实现问题,与信息的格式关系不大。
1.4 资料管理
资料管理功能设计来向研究人员提供记录和整理研究资料的能力,研究人员可以将自己在研究过程中查阅过的资料(包括书籍、网址、论文等信息)统一进行管理,避免可能的遗忘和混乱,研究人员可以标识出哪些资料被用于论文,这样在进行论文生成时就可以自动为论文生成引用列表。资料的来源主要有两类:一类来自用户主动的输入;另一类则来自用户上传论文时系统后台自动扫描后获取的信息。
1.5 论文分析与统计
在完成了论文管理信息系统的主要可见的功能设计后,就可以进行后台分析和统计功能的设计。为了给后续研究相关的算法设定一个范围,需要首先设计出系统能够为用户提供的论文分析和统计的功能,然后再根据相关功能的需求研究能够实现该功能的算法。一篇论文能够提供的数据和信息非常多,也非常复杂,通过机器目前还无法快速和完全的获得其中所有的内容。因此,首先需要確定系统准备从一篇论文中获得的信息和数据。
2 结语
任何一篇正式的论文,无论任何研究领域,都肯定包含着名称、作者、摘要、关键词和引用文献的信息,另外虽然完全通过机器读懂一篇论文很难,但是通过分析论文中的使用频度最高的某些词汇,也同时会获得一些有用的基本信息。除了这些基本的论文信息外,通过论文检索次数、用户评论、论文下载次数、用户存储于系统的研究文献等系统收集到的所有用户的系统操作数据,也同样能够间接的获取到与论文相关到信息。
参考文献
[1] 佐佐木达也,著.NoSQL数据库入门[M].罗勇,译.北京:人民邮电出版社,2011:1-2.
[2] Kai Hwang,Geoffrey C.Fox,Jack J.Dongarra,著.云计算与分布式系统[M].武永卫,泰中元,李振宇,等,译.北京:机械工业出版社,2012:3.
[3] Drew Conway,John Myles White,著.机器学习实用案例解析[M].陈开江,刘逸哲,孟晓楠,等,译.北京:机械工业出版社,2012:2-3.