我们计划的备份策略是否适合我的新服务器基础架构?

我们正在建立一个新的服务器来移动旧的服务器。¢ 基本上我们将有一个 Windows Server(2003 或 2008)运行 6 个以上的虚拟服务器(Windows 和 Linux 开发、应用程序、数据库以及几个RAID 5 上的筛选工作站)。

同样,我们需要系统化信息(文件以及 SVN 数据库),因此肯定需要文件 Web 服务器。 由于我们没有任何类型的管理经验,也从未做过备份, 您有虚拟化文件服务器的经验吗? 最好在物理盒子上运行它们? 任何关于运行它的建议肯定会受到欢迎。

关于我们的备份策略,同时勾勒出的一个是: ¢ 注意:由于资金限制,目前磁带备份不是我们的选择。

  • 每周对 RAID 5 上的单独备份服务器(请参阅 备份服务器应该使用 RAID 吗?)以及外部驱动器进行一次完整备份(可怜的人是磁盘驱动器)
  • 差异化日常备份
  • 计划每月对在线服务进行备份

你认为这个策略合理吗? 我敢肯定,我们无疑缺少很多元素。

最后,我们关心的一个假设是如何备份虚拟机设备。 一种简单的方法是简单备份everithing(如其中一个问题所建议的那样,我找不到 )。 ¢ 您对 vbox 中包含的数据有何建议? 应该额外备份(“只是在实例 "),还是直接备份在线照片安全?

如果它作为附加信息,我们打算使用 BackupExec。

感谢您花时间阅读本文。

- - - - - 2009/08/04 更新 - - - - -

由于健康因素,我无法继续回答这个问题。 非常感谢那些解决我问题的人,这是一个很大的帮助。

这是我们目前草拟的备份计划,我们已经获得了额外的历史:由于我们是一家小公司(来自南美洲),现在我们买不起磁带驱动器。

如果不是离线和离线,我现在的 bacukp 不是 bacukp,但我们正在尝试获得更好的资金限制方法:

数据丢失窗口:1 天/8 小时。 恢复时间:1 天/8 小时。 要备份的东西:所有(数据和网络服务器分期付款)

  • 每日:每天对物理备份 Web 服务器进行差异备份,可能使用 BackupExec。 有人建议在 sata 帮助下使用这些外部存储集线器。 另一个建议将其提交给存储解决方案,而我们可以获得磁带。 我们今天没有选择在异地之后采取(所以信息丢失窗口“假”)
  • 每周:使用外部 1TB 驱动器获取完整备份
  • 每月/每年:像常规一样。 我们遇到了存储这些备份的麻烦

我们希望保持简单,但我相信我们正在使用所有这些日常技术来解决异地备份泄漏问题。

1
2022-06-07 15:17:39
资源 分享
答案: 7

尼克的答案 - 请记住,这种方法适用于低成本的小型企业,为工作站购买名牌预建系统。 这是一个利用额外浪费的可用资源的场景。 我们使用所有可用的资源。 当用户离开一天时,他们的工作站将重新启动到集群中以进行自动构建和测试。 我提出的备份方法是一种利用每个工作站中的额外空间使用多台机器进行冗余副本的方法。

...乔,你说的实时系统是什么意思? 生产服务器?

是的。 突袭是为了减少时间损失。 因此,它应该在 24/7 运行的系统上使用。 对于仅需要在备份数据传输期间运行的备份系统或仅“需要”在白天运行的工作站而言,它的价值要小得多。

...因此,在您描述的选项中,计划是:在每个工作站中记录公共数据(加密)。

是的。 它可以是公共共享的或跨工作站的。 日志/快照在备份传输到另一种介质之间的 raid 系统上每小时更改一次,通常每天两次,中午和晚上。 (在生产系统上尽可能多地保留多达 80% 的磁盘空间的日志备份。在此之后性能可能会受到影响。)这样,用户可以轻松地恢复被覆盖或删除的文件,而无需通过转到他们的 /username 与系统管理员交谈RAID 生产系统上的 /date/time 文件夹并使用标准差异工具,可以访问当天所有可用的快照等。

加密是为了防止工作站被盗和/或防止“窥探”。 我们有优秀的开发人员,因此您相信他们不会尝试解密。 他们可以通过许多其他方式对业务造成损害,因此需要信任。

...这些快照每天使用 5 个外部磁盘进入系统,还是每天在 5 个磁盘之一中进行异地拍摄?

旅行数据总是在磁带上。 磁带经受住了冲击。 磁盘查找速度更快,这就是为什么我们更喜欢磁盘作为“日志”备份。 磁带是完整或增量备份,通常没有日志/快照。 大多数数据恢复将在白天完成 - 对于我们的用户群。 “我需要像午餐前一样的文件。” “我刚刚删除了错误的文件。” 从前几天恢复的粒度通常每天一个版本就足够了。 如果需要更多日志,则调整备份或实施修订控制系统并备份修订树。

这五个磁盘是一个任意数字,用于显示相对于仅磁带系统的相对成本。 五个具有相同数据副本的独立磁盘具有比任何小型企业 RAID 系统更高的冗余度。 如果工作站有足够的空间,一张专用的备份磁盘可能就足够了。 (假设工作站和磁带上有多个副本)

在设定的时间点,数据从生产服务器日志备份分区转移到备份系统,外部驱动器连接,制作 2-5 个副本,一个在内部磁盘上,一个在外部磁盘上,然后到磁带。 工作站备份到备份系统,然后在关闭每个工作站之前接收共享生产系统备份的副本。 备份数据的物理副本永远不会少于三个。 3副本、5副本等是一个冗余问题,需要针对每个业务和每个类型的数据进行建模。 您可能需要 5 份发票副本、7 份合同副本、仅 2 份标准图形副本和一份当前测试构建可执行文件的副本等。

...此外,每个工作站中的快照都相同吗? 还是他们都总结了完整的公共数据?

任何一个。 取决于可用空间和需求。 我们购买的系统总是带有比普通用户所需的磁盘大得多的磁盘(开发人员可能会使用额外的空间,但接待员不需要 500gb 以上的磁盘)

...您如何看待那些像 linksysbycisco.com/US/en/...这样的外部存储中心?

不知道。 我们更喜欢可以用于其他用途的机器,今天的备份服务器,明天某人的工作站,在重大升级期间卸载虚拟副本以进行快速故障转移等。这就是外部磁盘的原因之一 - 使所有工作站保持相似尽可能。 因此,“备份服务器”将拥有与每个工作站相同的 500GB 以上磁盘。 它是同一台物理机器,成套购买,所以随着时间的推移,CPU、内存和磁盘会根据当前的交易而有所不同。 机器是根据性能需求分配的,与在完美运行的机器上安装内存芯片相比,更换新机器以增加内存所需的总体系统管理时间更少。 如果我们保持 CPU 和视频(AMD64、Nvidia)相对一致,机器交换是无痛的。

生产服务器使用两个 RAID 卡,一个运行 10k rpm scsi,另一个运行 7200rpm scsi 驱动器,以获得最佳性能。 用于备份的 60 美元 SATA TB 驱动器可容纳价值数千美元的 scsi 驱动器、raid 控制器、热插拔机架机箱等。开发服务器通常足以使用 SATA raid,空间更大但性能更低。 由于同时用户较少,因此性能差异通常可以忽略不计。

简单来说 -

  1. 生产系统 - RAID“主数据分区”上的活动共享数据和操作系统
  2. 生产系统 - 自上次在 RAID“备份数据分区”上备份以来的每小时日志快照
  3. 工作站系统 - 非 RAID“主数据分区”上的活动数据和操作系统
  4. 工作站系统-非RAID“备份数据分区”上的备份数据

平均工作站购买了 500gb+ 驱动器,最多使用 ~40gb 用于多引导 windows/linux/bsd/opensolaris 分区。 其余的是备份分区,其中包含彼此工作站操作系统的备份副本、生产服务器的操作系统备份、生产服务器的日志数据备份和/或生产服务器的增量数据备份。

如果任何两台机器在建筑物中死机,恢复需要几分钟。 每个操作系统至少有三个物理副本,通常我们有足够的未使用的工作站 + 外部驱动器空间来保存来自生产服务器的一两个星期的增量备份和至少两个上次完整备份的副本。

我们可以丢失 RAID 系统、磁带和两个工作站,而不会丢失任何数据,并在几分钟内启动并运行。 (尽管在修复之前没有突袭)但是数据可以“立即”访问。 这在故障期间节省了数小时的时间,故障似乎总是在最糟糕的业务时间发生。 在重要的销售会议/演示之前,电源总是会出现故障。 突袭系统似乎总是在早上出现故障,从来没有在周五晚上出现故障,因此您可以修复它们并在周一早上恢复。

描述备份过程的文档是公司财产。 我将尝试使用图表和用例重新编写以供公众查看。 多年来,我一直使用这种通用方法,当标准磁带系统出现故障时,它可以节省时间和数据。 我在使用 DLT、LTO 等的 IBM、Compaq、HP 和 Dell 系统上看到过故障。常见的故障是备份期间没有错误,但是当您尝试恢复数据时,数据已损坏。 始终测试还原。 这就是为什么我们使用可以每天轻松测试的在线日志备份的原因之一。 自从用户习惯了它以来,我们从来没有超过一周没有人使用日志备份,而且几乎从不使用磁带。 这些磁带是为了以防建筑物被烧毁。

0
2022-06-09 15:46:44
资源
  • Raid 用于在线系统,并且可能/应该包含区域备份和/或日志快照
  • 磁带防震,可用于旅行、异地备份。 然而,磁带无法管理高循环率(典型的 250 次覆盖)
  • 磁盘成本更低,速度也比磁带快得多,并且具有更大的覆盖能力

如果您不具备专业知识,我不建议您将 raid 独立用于备份系统。 冗余更为关键。 由 5 个驱动器组成的 raid 系统通常比 5 个单独的驱动器具有更高的故障价格。 如果备份系统不足,那么在构建和检查新系统之前,每一件小事都会失败。 如果 raid 控制器不够用,那么每一件小事都会消失。 如果超过平价的驱动器数量不足,那么每一件小事都会消失。 您经常被固定在同一个控制器中,需要您获得一个备用控制器,否则将花费时间搜索以及在需要时用同一个控制器替换它。 您对磁盘大小和设计相当有把握。 如果驱动器在使用单独的磁盘时出现故障,您可以以相同的现金获得更新、更大的驱动器。

另一个选择是购买 5 - 1 TB 外部 sata 驱动器,每个 90 美元 - 总成本 450 美元

无需设备,无需RAID卡,无需RAID配置,每个驱动器都可以是不同的品牌、型号和尺寸。

转动驱动器,利用磁带在您的商业银行保险箱中进行异地存储。 您可能有大量可能的信息丢失窗口,但这可以通过在每个备份例程中备份多达 2 个甚至更多或磁盘和磁带和/或在在线系统上添加快照/日志来缓解。

如果您可以将数据直接划分为公共数据和个人数据,您可以利用工作站中的额外空间用于公共备份池。 在每个工作站中放置一个 TB,并从每个工作站分配 500mb 到备用游泳池。 将此位置用于公共数据备份副本或加密的私人备份信息。

这是最方便也是最快的恢复设置。 Bacula 在这种备份设计下发挥出色。 我见过和使用的最有效的配置是带有区域备份的在线 raid 系统,用于每小时记录差异备份,然后写入外部磁盘 - 确保在附近的工作站上备用空间以实现冗余,并且每天都在场外进行录音储存空间。

Raid 对活动系统有意义。 将您的 raid 5 更新为 raid 60 或任何最适合您的数据并加载的内容。 之后使用在线系统上的附加区域来存储快照备份。 区域磁盘备份是最快的,并且建议系统为备份购买提供最少的时间。 然后可以在整个午餐时间将这些照片支持到外部或磁带上,并减少白天的使用因素。

根据需要为每种数据类型、目录、文档等创建具有不同频率的备份计划。 尽可能经常在本地备份,最好是每次写入数据。 (日志)尽快从系统中获取区域备份。 (至少每天)尽可能多地复制备份数据。 (5通常绰绰有余)

1
2022-06-08 03:17:59
资源

我的常规备份建议:

备份的整个因素是能够带回来。 除非你完全有信心可以拿回你的东西,否则你的备份是无效 . 无论您在备份解决方案中实施什么,都需要从“我如何从中恢复?”的角度出发。

磁带并不昂贵,而且它的好处是它比磁盘更坚固。 更少的活动部件,没有实时的电气设备不断地体验它,这些都是好东西。 如果它在我的书中节省了你的屁股,那么它已经为自己付出了代价。

除了“您可以设法丢失多少信息”之外,您还需要考虑“在 DR 场景的情况下,您可以为停机支付多长时间?” 3天的恢复时间是3天的棚组织。 您必须以小时为单位计算您的带回时间,并且还用一只手的手指计算。

如果您允许自己对此感到偏执,那么您真的可以迅速获得愚蠢的资金,因此您需要将您的 Web 服务器分成 2 或 3 个批次。 那些你肯定需要现在回来才能继续你的核心服务功能,而那些你可以推迟到核心服务功能回来之后。 将大量资金投入到第一批中,确保您已完整记录恢复处理(用于操作系统、应用程序以及数据),以使一只手连接在背后的盲麻风猿可以遵守. 发布和绑定副本,并将其保存在防火保险箱中 - 如果你所拥有的只是一个数字复制品并且会脱落或损坏,那么你就完蛋了。 但是不要相信这意味着您可以对第二批内容松懈,只是您可以推迟将它们取回或花更长的时间(例如,将它们放在较慢的媒体上)。

详细信息示例:您的核心文件服务器肯定会进入第一批。 您的 HR Web 服务器进入第二大交易。 这对人力资源人员来说非常重要,但是在没有人力资源系统的情况下,您的核心业务功能是否可以正常工作? 是的,我想他们会的。

保持您的备份选项基本和沉闷。 我经常看到人们实施花哨或复杂的备份补救措施,最终变得非常复杂、繁琐和不可靠。 由于备份的事实,备份正在耗尽应该无聊。 它们越简单,恢复就越容易。 你想要一个“我 Og,Og 点击切换,Og 获取信息”的策略。 在其中保留日常指南组件。 这有助于开发演习,这可以避免人们忘记更换磁带或在池中转动 HD 的情况。 如果发生这种情况,您可以在事后解除责任人,但您猜怎么着? 您仍处于丢失一个月数据的环境中。

3
2022-06-08 03:17:37
资源

我当然会建议在物理机器上运行文件服务器,因为它很可能是相当繁重的 I/O。 能够在不关闭所有 VM 的情况下热插拔死驱动器也将是一件好事。 不过,这取决于您的特定配置。

您的备份计划似乎是明智的,但取决于您可以设法损失多少。 看起来您的大多数备份(除了每月的常规备份)都在网站上,这表明如果结构被烧毁或被卷入,您最多会损失一个月。

如果您使用外部驱动器,则需要将其保留在家里,直到备份到期之前,否则它不是真正的离线备份,是吗? 如果你对此有纪律,你会在一周内脱落。 更好的办法当然是在硬盘外旋转一个三分相,这样你就可以不断地在网站上拥有最旧的一个,在网站外拥有最新的一个。

不要忘记定期测试并记录您的备份; 您需要放心,您的每个备份系统都可以正常恢复。 您需要文档,以便您的一位同事可以恢复信息。 您还需要有关如何恢复整个服务器的文书工作。 如果一个失败了,你就会有太多的事情要记住每一个细节。

题外话:当它发生时,我正在为我们的小公司寻找一个类似的框架。 可比的经验程度,尽管我们目前确实有后备人员。 我将与您分享我们当前的设计,为您提供另一种观点,而不是评判您自己的观点: ¢ 我们计划三台服务器:两台虚拟化主机和一台存储服务器。 存储服务器肯定会运行 打开文件管理器。 它肯定会通过(可能是双)千兆以太网连接到两台主机,两者都具有良好的 CPU 和充足的内存,但几乎没有任何存储空间(可能只是小型 SSD)。 这些主机肯定会在 裸机 上运行 Citrix Xenserver(或可能是 VMWare ESXi),因为它比在通常不会做太多事情的附加操作系统中运行虚拟化软件程序可靠得多(例如,查看性能差异在 VMWare 服务器和 VMWare ESXi 之间)。 Xenserver 看起来最吸引人,因为它完全免费提供企业属性,而 ESXi 如果您想要的不仅仅是基本功能,它可能会变得昂贵。 Xenserver 主机本身没有存储,但肯定会通过 Openfiler 服务器中的 iSCSI 作为 虚拟硬盘 使用块级存储。 Openfiler 可以做照片、RAID 等等。 Xenserver 可以将数字设备从一台服务器实时迁移到另一台服务器,因此我们可以在一台服务器上进行维护,而无需关闭任何类型的来宾 VM。 获得一个支持 VLAN 的千兆按钮,这样您就可以将存储空间网站流量与 VM 流量分开。 几个 UPS 是为了在电源故障的情况下启用调节关闭以及您完成。 考虑到软件程序是(令人惊讶的)免费的,几乎所有的价格都是设备的。

抱歉,这个解决方案有点长,但我真的希望另一种观点对你很重要。

0
2022-06-07 15:52:23
资源

缺口,

我强烈建议您看一下 O'Reilly 的“Backup & Recovery”一书。

http://oreilly.com/catalog/9780596102463

它将向您描述诸如“单点故障”之类的术语以及备份重要系统的基本策略。

这是一本伟大的书,任何人都是书架。

2
2022-06-07 15:52:08
资源

关键问题是您准备好要丢弃多少数据? 1个月? 一天? 6小时? 5分钟?

随着数据丢失窗口变得更小,它变得更加昂贵。

1
2022-06-07 15:48:10
资源

b我将发表我经常对“备份”发表的评论:

备份不在现场,也离线。 如果它不是异地和离线,则它不是备份。

  • 如果建筑反驳,异地是非常重要的。 现场但脱机(想想抽屉中未插入的外部硬盘驱动器)之后,当结构反驳时它就消失了(参见 清理服务器的烟灰 )。

  • 如果有人袭击您并试图破坏您的数据,则必须离线。 如果它不在网站上,但之后在线,它就有受到攻击和“腐败”的风险。 离线意味着“备份和网络之间的气隙”。

备份之道 是一个有点俗气的推销,但是网站上的每一件小事都是真实而重要的信息。 我会鼓励阅读它。


我当然会在物理机器上运行数据服务器。 文件服务是 IO,虚拟化也适合 IO。 虚拟化对于“需要”不同操作系统实例但不需要整个物理机器的马力的应用程序来说非常棒。 对于完全基于 IO 的应用程序,虚拟化意义不大。

您必须阅读我的 服务器故障备份综述 电子表格,比较各种备份解决方案。 LTO - 4 以及用于 5 周车削的磁带不是昂贵。 如果您选择 LTO - 3、LTO - 2 或 VXA 等低端磁带技术,则成本更低。

如果您还想获得有关备份的更好建议,请告知我们以下几点:

  • 总要备份多少信息
  • 每天调整多少数据
  • 备份窗口多长时间
  • 您打算保留多少备份
  • 您肯定会永久保留多少次备份
  • 您多久会轮换一次备份媒体 - 网站
  • 您打算转多少媒体/周

您现在在您的问题中提出了其中的一些内容,但我问自己您是否真的分析过,例如,如果您每月进行非网站复制,并且您有 2 天的灾难,它将对您的组织产生什么影响在下一个定期每月关闭之前 - 网站重复。 我当然会建议您在与组织中的程序人员交谈后重新分析您的需求,并询问他们公司丢失大量数据(关于数小时/天/数周的数据)将花费的美元数.

(您可以在我的“服务器故障备份综述”文档中获得更多关于假设的详细信息:大约 2009 年推荐的备份媒体?

1
2022-06-07 15:46:44
资源