备份方案技术及应用【10】
文章目录备份方案概述为什么需要备份备份面临的挑战什么是备份备份、容灾、归档备份方案架构备份系统的组成备份系统的三要素(BW、RPO、RTO)备份策略备份方案架构本地集中备份一体化备份本地和远程集中备份多分支集中备份典型备份网络LAN-BaseLAN-FreeServer-Free常用备份技术多种备份特定统一管理全局重删重删技术分类高可靠系统易扩展说明快照备份兼容性支持说明备份应用案例案例1案例2案
·
文章目录
备份方案概述
为什么需要备份
- 数据备份是数据保护的最后一道防线。
- 相对于IT环境的发展,备份软件发展滞后。
备份面临的挑战
什么是备份
- 备份的定义:
- 为应付文件、数据丢失或损坏等可能出现的意外情况,将电子计算机存储设备中的数据复制到磁带等大容量存储设备中
- 备份实际就是一种“复制”操作,备份数据通常以另外一种格式保存
- 备份目的是为了恢复
- 在一套备份系统中,通常包括以下组件:
- 备份服务器:备份服务器是运行备份软件的载体,一般是PC服务器和小型机。
- 备份软件:备份系统的核心,备份软件控制生产数据拷贝到存储介质上,并对备份数据进行管理,如Symantec的Backup Exec和NetBackup等。
- 存储设备:备份数据存储的设备,一般为磁盘阵列、物理磁带库或者虚拟带库。
备份、容灾、归档
备份是容灾的基础。
备份方案架构
备份系统的组成
- 备份服务器:维护所有的配置信息(客户端,介质代理,备份设备等),管理所有的作业和历史任务记录,提供GUI/WEB等管理界面
- 介质服务器:负责管理数据在物理存储设备和它对应的客户端代理之间传输数据。
- 备份介质:
- 磁盘阵列:适用于数据量大,备份窗口相对较小,对备份设备的性能和可靠性要求很高的场合,如数据中心。产品如华为OceanStor V3系列、18000系列等。
- 磁带库:适用于备份数据量不大,时间窗口宽裕,或希望将数据异地离线长期保存的场景。如HPMSL6060、IBM TS3310 等。
- 虚拟带库:需继承企业原有磁带备份架构和策略,又需提高备份速度的场景,如华为VTL6900。(VTL:Virtual Tape library虚拟磁带库。可以融入到现有磁带备份环境中,和磁带产品配合使用,构成一个集磁带和磁盘两种技术优势的解决方案。)
- 光盘塔、光盘库:适用于对速度要求不高,容量不大,不用经常擦写的场景,如教育、档案、图书馆、广电等行业,如SONYPDJ-1080。
- 云存储:适合备份数据量不是很大的业务,如OceanStor 9000 、 FusionStorage 。
- 一体机:就是将主服务器,介质服务器,备份介质集成到一个物理设备上。如:HDP3500E。
备份系统的三要素(BW、RPO、RTO)
- BW(Backup Window):一个工作周期内留给备份系统进行备份的时间长度。
- RPO (Recovery Point Objective):可以承受的最大数据丢失量。
- RTO (Recovery Time Objective):可以承受的最长停机时间。
备份策略
- 备份策略的选择:
- 多于操作系统和应用软件,在每一次系统更新或者安装了新的软件后做一次全备份。
- 对于关键的应用数据,涉及每天大量的数据更新,但是总数据量不是很大,我们可以用户在使用少量数据的时候每天做一个全备份。
- 对于关键应用,且相对数据的总量每天只有少量的数据更新,我们可以在每月或每周做一个全备份,在次基础上可以在一系列短一点的间隔上做增量备份。
- 典型备份类型:
- 完全备份:每天全备份。
- 优点:能够基于上一次的完全备份快速恢复数据,恢复窗口小。
- 缺点:所占用的存储空间大,每次备份耗时长,备份窗口大。
- 累积增量式备份:每周一次全备份,本周其余每天备份与上次备份的差异部分。
- 优点:相对完全备份来说每次备份可以节约一个完全备份的存储空间,备份窗口较小,恢复窗口较小。
- 缺点:恢复时必须依赖上一次完全备份和本次的累积增量式备份才能完整恢复数据,恢复时间较差异增量式备份较短。
- 差异增量式备份:每周一次全备份,本周其余每天备份与全备份的差异部分。
- 优点:能够最大限度地节省存储空间,备份窗口小。
- 缺点:数据恢复时必须依赖上一次完全备份和每一次的差异增量式备份才能对数据进行完整恢复,恢复时数据重构较慢,恢复时间较长。
- 完全备份:每天全备份。
备份方案架构
本地集中备份
- 场景:本地DC集中备份、运营商、企业等。
- 支持的平台:
- 支持Windows, Linux和UNIX平台的文件和应用备份。
- 支持VMware, Hyper-V, FusionCompute虚拟化平台备份。
- 方案亮点:
- 支持并行重删,节约备份存储空间;
- 支持调用华为阵列的硬件快照进行数据备份, 业务零影响,秒级恢复;
- 全图形化GUI统一管理,无需编写任何脚本,操作维护简单。
一体化备份
- 场景:SMB、分支机构小数据量的本地备份
- 支持的平台:
- 支持Windows, Linux和UNIX平台的文件和应用备份
- 支持VMware, Hyper-V, FusionCompute虚拟化平台备份
- 方案亮点:
- 备份服务器、备份存储一体化,设备和维护费用减少50%;
- 全图形化GUI统一管理,无需编写任何脚本,操作维护简单。
本地和远程集中备份
- 场景:
- 本地DC集中备份、运营商、企业等
- 远程备份
- 支持的平台:
- 支持Windows, Linux和UNIX平台的文件和应用备份
- 支持VMware, Hyper-V, FusionCompute虚拟化平台备份
- 方案亮点:
- 支持并行重删,节约备份存储空间;
- 支持调用华为阵列的硬件快照进行数据备份, 业务零影响,秒级恢复;
- 全图形化GUI统一管理,无需编写任何脚本,操作维护简单。
多分支集中备份
- 场景:
- 本地DC集中备份、运营商、企业等
- 统一管理
- 支持的平台:
- 支持Windows, Linux和UNIX平台的文件和应用备份
- 支持VMware, Hyper-V, FusionCompute虚拟化平台备份
- 方案亮点:
- 支持并行重删,节约备份存储空间;
- 多个备份域统一管理,运维管理成本降低50%;
- 支持调用华为阵列的硬件快照进行数据备份, 业务零影响,秒级恢复;
- 全图形化GUI统一管理,无需编写任何脚本,操作维护简单。
典型备份网络
LAN-Base
- LAN-Base:备份数据流通过现有LAN网络进行传输。
- 优点:
- 充分利用现有网络,节省投资。
- 对设备的要求较低。
- 缺点:
- 占用现有网络带宽。
- 备份性能受限。
- 对主机应用有一定影响。
LAN-Free
- LAN-Free:备份数据流通过SAN网络进行传输。
- 优点:
- 对现有业务网络影响小
- 备份性能好
- 缺点:
- 对网络的投资较大
- 对设备的要求较高
Server-Free
- Server-Free:备份数据流不经过生产服务器,而是通过独立网络进行传输。
- 优点:
- 对业务主机几乎无影响
- 对现有业务网络几乎无影响
- 备份性能好
- 缺点:
- 对网络的投资较大
- 对设备的要求较高
常用备份技术
多种备份特定
统一管理
- 集中管理的对象包括企业的主服务器、所有介质代理、存储设备和客户端代理。
- 统一管理的内容包括:
- 统一性能管理,如:历史性能统计,性能数据导出等。
- 统一监控管理,如:系统状态实时监控,资源业务状态查询等。
- 统一设备管理,如:物理设备管理,简单的配置向导等。
- 统一资源管理,如:统一存储资源管理,物理磁盘和共享存储空间的统一管理等。
全局重删
- 重复数据删除(Deduplication)技术,简单来说,就是一种消除重复数据的技术,它用软件或硬件的方式,对存储数据进行处理,以消除其中的重复数据,从而减小数据占用的存储空间。
- 重复数据删除的实现过程:需要存储的数据,以块为单位进行哈希比对,对已经存储的数据块不再进行存储,只是用索引来记录该数据块。对没有存储的新数据块,进行物理存储,再用索引记录,这样相同的数据块物理上只存储一次。通过索引,可以看到完整的数据逻辑视图,而实际上物理存储的数据却很少。
- 原始数据存储在介质上。
- 重删时以一定的数据块大小为单位进行比对。
- 唯一的数据存放在重删后的空间里,后面的数据跟唯一数据进行比对,重复的数据则被删除,同时在指定的空间存放Index和Metadata。
- 没有重复的数据则将这部分作为唯一数据保留在重删后的空间中,同时写入Index和Metadata。
- 对备份的价值:
- 能更有效的节省存储的空间,大大提高存储的利用率,降低用户的TCO。
- 减小备份窗口。
- 收益:
- 嵌入式: 包括源端和目标端重删
- 工作更快、更智能:在线处理使备份加快50%且网络简化90%
- 内置复制:利用经过去重优化的复制来创建异地副本
- 网络优化:使用本地查询缓存来维护WAN连接的性能
重删技术分类
- 重删技术可以按照重删的位置、时刻、粒度、范围等多个维度进行分类。
- 源端重删:先删除重复数据,再将数据传到备份设备。即:当数据从“源端”传输到“目标端”的过程中,在源端先对被传输的数据块进行哈希比对,如果该数据块先前已经被传输过,只需要传输哈希索引值。如果该数据块先前没有被传输过,就传输该数据块,并记录该数据块的哈希值。优点:可节约传输带宽。缺点:要占用源端资源进行去重处理。
- 目标端重删:先将数据传到备份设备,存储时再删除重复数据。即:当数据从“源端”传输到“目标端”的过程中,把数据块传送到目标端,在目标端进行去重操作。优点:不占用源端的资源。缺点:不能节省传输带宽。在目标端有两种处理方式:
- 在线处理方式(In-Line):在数据块存储之前进行去重处理,优点是占用存储空间较少,缺点是要影响数据传输性能。
- 后处理方式(Post-Processing):先把数据块存储在缓存中,等系统空闲时再进行去重处理。优点是不影响数据传输性能,缺点是需要额外的存储空间。
- 在线重删(Inline):数据写入磁盘之前进行重复数据删除。
- 后处理重删(Post-processing):数据写入磁盘后开始进行重复数据删除。
- 适应性重删(Adaptative Data Deduplication):性能要求较低的环境下采用在线重删,性能要求较高的时候采用后处理重删。
- 文件级重删:也称为单实例存储(SIS),根据索引检查需要存储文件的属性,并与已存储文件进行比较如果没有相同文件,就将其存储,并更新索引;否则仅存入指向已存在文件的指针。
- 块级重删:将文件/对象分解成固定长度或不定长度的数据块,对数据块进行哈希计算,并与已存块的哈希值进行比较,只存储唯一哈希的数据块。
- 字节级重删:从字节层次查找和删除重复的内容,一般是通过压缩算法对用户数据进行压缩存储。
- 本地重删:查找重复数据时,仅和当前存储设备内的数据进行比较。
- 全局重删:查找重复数据时,和整个重删域中的所有存储设备的数据进行比较。
高可靠系统
- 备份解决方案设计中所有三层的高可用性设计确保日常备份任务能够在没有任何系统损坏的情况下完成。
- 备份服务器的HA:两个备份服务器能够以HA模式部署,提高可靠性。
- 介质带你的多路径:所有介质代理以A-A模式工作并具有多路径支持,用于负载均衡和切换。
- 双控制器:存储设备的双控制器使存储装置更稳定、更可靠。
- 备份客户端会通过服务器切换来自动切换到集群中的另一服务器。
- 自动切换:自动检测集群状态,自动切换。
- 快速开关:服务器切换后,快速恢复备份作业。
- 维护工作少:无需监控状态,备份可靠,维护工作较少。
易扩展说明
-
在单个域中管理整个企业数据保护,具有良好的向外扩展能力。介质代理维护颗粒索引信息,以支持数百万对象。
-
集中管理:使用分裂索引对所有信息进行集中管理。没有额外的维护成本。
-
高灵活性:介质代理易于扩展,以支持更多数据。
-
大规模:支持10000个客户端,比集中索引多100倍。
-
颗粒恢复:单个对象的颗粒恢复,适用于VM、文件、 Exchange 、SharePoint、Lotus Notes。
-
软件复制:
- 优点:易于管理,支持从备份中心直接恢复备份数据。
- 缺点:软件复制需要许可。
-
存储复制:
- 优点:无需软件许可。
- 缺点:管理复杂。
快照备份
- 通过快照集成支持存储阵列。
- 支持脱离主机的基于代理的备份。
- 具有快速可恢复能力:
- 浏览备份内容,快速恢复所选对象。
- 在后台将增量备份合并到全量备份以迅速恢复数据。
- 从硬件快照恢复数据,还可以采用快照进行细颗粒度恢复。
- 恢复副本:
- 存储阵列保护:本机格式,存储自动发现,完全集成(无脚本),快照支持。
- 存储阵列恢复:复原卷,克隆/挂载,拷回数据。
- 保留副本(可选):
- 有索引的保留副本:保护所有数据或仅保存有关数据。全部分层选项(磁盘/云/
磁带)。对齐保留与恢复策略。 - 阵列外保留:数据去重、压缩和加密选项。存储和位置独立。
- 全部恢复选项:依赖于代理,跨服务器、全量(BMR)至颗粒级恢复。
- 内容索引感知:代理/颗粒选项。
- 有索引的保留副本:保护所有数据或仅保存有关数据。全部分层选项(磁盘/云/
兼容性支持说明
- 更多信息,请参考:http://documentation.commvault.com/commvault/v11/article?p=landing_pages/c_backup_agents.htm
- 广泛的文件系统兼容性支持:
- Windows:2016、2012、2008、2003、10、8、7、Vista、XP
- Linux:
- Asianux、Debian、Fedora、Gentoo、Mandriva、NeoKylin
- OpenSuSE、Red Flag、Red Hat、Scientific、Slackware
- Source Mage、SuSE 、Ubuntu、Z-Linux、Oracle、
- Unix:IBM AIX、HP-UX、Oracle Solaris、FreeBSD
- Other OS:Mac、IBM iSeries、OpenVMS、Novell OES
- Storage:
- Dell、EMC、Hitachi、Huawei、IBM N-Series
- NetApp、NextaStor、Nexsan、Oracle ZFS、Stratus
- 广泛的数据库和应用兼容性支持:
- Oracle、Oracle RAC
- SAP for Oracle、SAP MaxDB、SAP HANA
- SQL Server、SQL Server Always On
- Exchange、Active Directory、SharePoint
- DB2、DB2 MultiNode
- Sybase
- Informix
- MySQL、PostgreSQL
- IBM Domino
- Documentum
- 广泛的虚拟化环境兼容性支持:
- VMware
- Hyper-V
- OpenStack
- Xen Server
- RED HAT Enterprise
- Nutanix
- Huawei
- Docker
- Oracle VM
- Azure
- Amazon
备份应用案例
案例1
- 业务挑战:
- 现网应用以虚拟机平台为主,备份性能低。
- 图书馆书籍分类数目多,缺乏统一的备份平台。
- 需要建立一个异地灾备中心,保证备份数据安全。
- 解决方案:
- 使用LAN_Base组网方式部署,采用Enterprise集中备份解决方案。
- 采用Simpana作为备份软件,华为存储作为本地备份介质及异地灾备中心备份介质。
- 客户收益:
- 不需要在每台虚拟机上安装代理软件,并及时自动发现新增虚拟机,保证了虚拟机平台的高效备份。
- 采用重复数据删除技术,大大降低了存储资源的占用。
- 通过远程复制技术,实现快速可靠备份。
案例2
- 业务挑战:
- 检察业务数据快速增长,管理工作困难。
- 缺乏统一业务应用平台进行业务备份。
- 希望建设一套备份系统,能实现业务备份平台与上下级单位进行数据交互。
- 解决方案:
- 建设统一备份平台,使用Simpana作为备份软件,VTL6900作为备份介质。
- 部署LAN_Base、LAN_Free混合组网,最大化利用现网资源。
- 采用重复数据删除技术,降低存储空间消耗。
- 客户收益:
- 实现高检统一业务数据库、本地业务应用数据库、及应用服务器及非关键业务系统的高性能备份。
- 新建统一业务备份平台,完全满足上下级单位数据交互需求。
- 对不断增长的数据统一备份管理,备份系统支持弹性扩展。
- 重复数据删除降低了带宽及存储设备的消耗。
- 生产存储:统一业务应用软件的数据存储采用SAN+NAS存储架构,结构化数据采用SAN的方式存储,文件类非结构化数据采用NAS的方式存储从而实现数据的大集中存储。
- 备份采用近线备份加离线的方式:
- 近线备份,主要用于恢复数据业务数据,可采用虚拟带库方式实现,以便在规定时间内能完成大容量数据备份任务。由于虚拟磁带库支持压缩存储和删除重复数据技术,对于案件数据这种数据块重复率很高的数据压缩率能达到10:1或更高。
- 离线备份采用物理带库来实现,LTO5驱动器在不压缩的情况下可以存储1.5T,一般离线备份按照需要存储数量的7倍进行计算,即45*7=315T,所需要的槽位数应不少于:315/1.5=210。
- 统一应用数据库和本地业务应用数据库采用LAN-FREE的备份组网。
- 非关键业务系统采用LAN-BASE备份组网。
案例3
- 面临的挑战
- DAS存储架构,存储扩展困难,管理成本高
- 无集中备份系统,需手工操作,且可靠性不高
- 华为解决方案
- 生产中心部署一套NBU + VTL备份系统
- 灾备中心部署一台VTL
- 生产中心与灾备中心VTL之间,通过IP网络, 进行远程备份数据复制,达到容灾
- 客户价值
- RTO、RPO为天级,当生产中心出现故障,所有数据可恢复到上一次备份点,减少企业的直接经济损失和名誉损失。
- 投资较少,实现了本地保护和异地容灾。
- 实现存储的在线动态扩展,降低维护成本。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献32条内容
所有评论(0)