重复数据删除技术:面向大数据管理的缩减技术
上QQ阅读APP看书,第一时间看更新

第2章 存储技术基础

数据存储是将经过采集或加工整理后的数据按照一定格式和顺序记录到计算机内部或外部特定存储载体中的活动,其目的是便于数据管理者和用户快速、准确地识别、定位和检索数据。随着计算机技术和因特网技术的不断发展以及网络用户数量的快速增长,各类数据呈几何级数增长。图灵奖获得者Jim Gray提出了一个新的经验定律:“网络环境下每18个月产生的数据量等于有史以来数据量之和”[1]。目前,很多应用领域的存储需求已经达到PB级,甚至EB级,如石油勘探、气象数据分析、卫星数据处理、医学视频图像处理、金融数据分析、多媒体点播等应用领域。信息技术正从以计算设备为核心的计算时代进入以存储设备为核心的存储时代,网络化存储将成为研究的热点。信息资源的爆炸式增长,对存储硬件、I/O接口以及系统架构等方面提出了越来越高的要求,这也为存储技术的发展带来了新的挑战。为更好地理解大数据管理技术,我们在此简单介绍一些基本的存储技术知识,包括主要的存储介质、存储接口、存储系统架构及数据保护技术等方面的内容。