手机版
您的当前位置: 钻爱网 > 书信 > 通知 > 大数据时代图书馆海量数据的存储安全管理 老图书馆

大数据时代图书馆海量数据的存储安全管理 老图书馆

来源:通知 时间:2019-11-10 08:12:16 点击:

大数据时代图书馆海量数据的存储安全管理

大数据时代图书馆海量数据的存储安全管理 大数据时代下,数据海量且纷繁复杂,这在丰富图书馆资源的同时也给图 书馆数据存储安全管理等方面带来了新的挑战。本文立足于对大数据的特征把握, 结合目前图书馆面临的存储安全管理问题,探讨了图书馆存储安全管理的有效策 略,以期构建更加科学、高效的图书馆存储与安全管理模式。

1 大数据时代下的数据特征 关于大数据至今各界尚未有一个统一且全面的定义,但笔者比较认同 的一个定义方式是:大数据是难以在传统思维及常规软件的基础上,在规定时间 内对其内容实施采集、管理及分析的数据集合[1]。大数据时代下的数据具有数 据量大、数据类多、流动速度快、价值密度低等特点。不难看出,在大数据的背 景下无论是从管理角度还是技术角度,对于图书馆的数据安全管理,尤其是基于 海量数据的数据存储安全管理,都是新的挑战。

1.1 数量巨大 通常认为,数据量大于10TB即为大数据。伴随着计算机、云计算、 物联网等技术普及,以及社交网络对人们生活的不断渗入,人们的个人信息、网 络足迹、网络交际等数据爆炸性增长,这些信息与长期积累的结构化数据共同构 成了大数据。对于图书馆来说,纸质电子资源增多,以及用户增多带来的大量用 户信息,随着时间推移,数据量会越来越大。

1.2 种类繁多 数据种类繁多主要是指数据结构的多样化。伴随着传感器技术、移动 终端、通信设备的广泛应用,数据结构形成结构化、半结构化和非结构化共存的 局面,如音频、视频、网页等形式。

1.3 流动速度快 流动速度快主要指数据创建与处理速度。实时性是大数据的一个显著 特征,生活在互联网环境中,人们通过移动终端使用的各类应用,如天气、物流、 交通等应用,这些应用使用或产生的数据都是具有实时性的,即为流式数据。对 于这些数据,传统的软件显然不能处理。1.4 价值密度低 大数据的价值获取和应用是大数据应用的最终目标。然而在数据大量 增长的同时,蕴含于其中的数据价值并未显著增长,因而数据价值密度降低,这 就大大增加了获取有价值信息的难度。

2 大数据时代图书馆面临的存储安全问题 在大数据背景下,图书馆非结构化数据占80%以上,这为图书馆数据 存储方面提出了新的要求,具体体现在存储模式、安全级别划分、身份验证等方 面。

2.1 存储模式局限 随着数据量及数据复杂程度的迅速增长,非关系型数据库由于可扩展 性及可用性较强优势被广泛应用,成为图书馆数据存储的主要方式。然而,由于 非关系型数据库系统服务器软件内置安全管理系统不足且存在较大安全漏洞,造 成在数据访问控制及用户隐私管理方面存在较大难度。

2.2 安全级别划分问题 图书馆在统一管理平台对数据进行存储、管理、分析、应用的过程中, 难以对数据按照安全级别进行划分并分类存储。同时,数据库在用户进行访问的 过程中,会将组织架构暴露给发起访问的程序,安全性受到威胁。另外,由于用 户在操作中与多个信息节点进行通信,数据库难以对访问者身份权限进行即时验 证。

2.3 安全管理产品局限 非结构型数据库在进行大数据资源操作中,会在多个网络通信会话间 建立协调任务,因而传统安全管理产品具有的系统监视、日志分析以及安全评估 等功能难以运行或难以取得良好效果,同时还可能对大数据应用效率等方面带来 不利影响。

3 大数据背景下的图书馆存储安全管理策略 3.1 利用大数据决策及时发现安全威胁图书馆在利用大数据技术来保护自身系统与服务安全时,不应仅仅将 防范目标锁定在恶意事件的发现上,也应结合大数据安全资源进行分析,确定恶 意攻击的来源、攻击途径及危害程度等,并结合数据挖掘与关联技术,实现对未 来攻击的来源、途径及目的预测,提前把握危害程度,做好防范。

同时,在安全管理大数据平台的构建过程中,在维持平台一定的复杂 程度与合理建设成本的条件下,尽可能选取技术成熟且兼容性强的数据包捕捉与 分析工具,以此来实现信息的快速采集、定位与科学分析、决策的过程。而系统 结构过于复杂的安全管理产品会导致平台功能性与可控性的大幅度降低。

同时,加强对安全数据仓库诸如监控日志、工作日志、服务器日志、 防火墙日志等的管理控制,有助于图书馆大数据资源安全高效地处理以及安全攻 击行为的及时发现。

另外,在了解图书馆大数据服务与安全管理需求的基础上,定制大数 据资源挖掘工具以及相应的分析师,来提高图书馆利用大数据技术发现安全威胁 的效率与主动性。

3.2 构建大数据安全威胁与防御能力为基础的评估体系 建设以大数据安全威胁与防御能力为基础的评估体系,是图书馆构建 高效安全防御系统的关键内容,评估体系分为宏观网络感知与微观威胁检测2部 分。

网络是图书馆各类信息传输的载体,在网络层面上,对于数据中心内 部网络与外部传输网络的评估,需广泛地在网络上设置大量安全检测与数据采集 设备,以此来保证安全评估平台全面且客观地收集网络安全评估数据。

在微观层面上,应注重数据采集并构建安全评估指标。应重点采集 APT攻击方法、路径、后果等,并建立模型模拟预测。而在评估指标的建立上, 应从大数据平台二次提取数据,并分为基础指标与应用层指标等多种类型,结合 不同指标对图书馆安全的影响,进行科学的动态评估。

同时,由于结构化数据可降低对大数据平台的性能要求并提高分析效 率,图书馆也应加强对采集数据的结构化处理,从而提高安全分析效率与分析结 果的可靠性。3.3 整合大数据安全管理软硬件平台

推荐内容

钻爱网 www.zuanai.cn

Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1

Top