Synology群晖如何设置和配置SHA集群

作者:成都NAS存储服务器总代理 来源:

设置和配置 SHA 集群成都synology群晖总代理

3.1 连接主机

若要为集群和 Heartbeat 连接实现更宽的带宽,建议您按如下所示设置网络接口:

  • 如果您有四个 1 GbE 网络接口可用,请为集群和 Heartbeat 连接设置双接口 Link Aggregation。
  • 如果您有两个 10 GbE 网络接口可用,则建议您使用其中一个作为集群连接,使用另一个作为 Heartbeat 连接。

本节将说明如何连接两台主机以创建高可用性集群。

  1. 使用网线连接两台主机。此连接将用作两台主机之间的 Heartbeat 连接,并协助进行从主服务器到备用服务器的通信和数据复制。此连接必须满足 Heartbeat 连接一节(第 2 章:所需环境 > 系统要求 > 网络环境)中列出的要求。
    3.png
  2. 通过其余网络接口,使用网线将两台服务器连接到网络。请确保这些连接正常工作且属于相同网络。为了避免因网络断开连接而导致的服务中断,建议您在网络环境中使用多台交换机。
    4.png
  3. 主机现已准备就绪,可组成一个高可用性集群。继续阅读下一节。

3.2 创建集群

使用两台新的 Synology NAS 创建集群

本节提供有关如何使用两台新的 Synology NAS 创建高可用性集群的说明。例如,我们将使用两台全新的 DS1621+ Synology NAS,即服务器 A(主)和服务器 B(备用)。在此示例中,集群是在创建任何存储空间之前创建的。使用两种不同的型号(混合式高可用性集群)可能会对集群产生影响。有关更多信息,请参阅如何使用两台不同型号的 Synology NAS 服务器创建高可用性集群

  1. 如果需要,请在每台设备上前往控制面板 > 网络 > 常规以编辑服务器名称
  2. 前往控制面板 > 网络 > 网络接口,为 Heartbeat 连接选择网络接口,然后单击编辑。然后选择自动获取网络配置 (DHCP)。完成后单击确定
  3. 两台服务器的 IP 地址必须属于相同子网,并且必须分配有静态 IP 地址。若要分配静态 IP 地址,请选择网络接口,单击编辑,选择使用手动配置,然后输入所需信息。
    例如,请参阅以下设置:
    • 服务器 A
      • 服务器名称:NAS-A
      • LAN 1:DHCP IP 地址
      • LAN 2:静态 IP 地址 10.17.196.12
    • 服务器 B
      • 服务器名称:NAS-B
      • LAN 1:DHCP IP 地址
      • LAN 2:静态 IP 地址 10.17.196.13
  4. 在每台服务器上,前往套件中心并安装 Synology High Availability
  5. 使用属于 administrators 群组的帐户登录您想指派为主服务器(服务器 A)的主机。
  6. 打开 Synology High Availability
  7. 单击创建高可用性集群以打开集群创建向导。
    5.png
  8. 请仔细阅读开始之前的准备页面的内容。确认两台服务器的配置满足要求后,单击下一步
    6.png
  9. 如果建议网络配置满足您的需求,请根据建议配置您的网络。
  10. 集群连接和 Heartbeat 连接选择网络接口。例如,我们将 LAN 2 用于集群接口,将 LAN 1 用于 Heartbeat 接口。单击下一步
    7.png
  11. 输入属于备用服务器 administrators 群组的帐户凭据。单击下一步
  12. 指定高可用性集群的名称以及将用于访问集群的 IP 地址。集群 IP 必须与两台服务器处于同一子网中,并且必须是静态 IP。请勿使用 DHCP IP。完成后单击下一步。例如,我们使用了以下名称和 IP 地址:
    • 集群主机名:NAS-HA
    • 集群静态 IP 地址:10.17.196.14
  13. 向导将检查系统是否满足要求。验证完成后,单击下一步
    8.png
  14. 确认设置并单击完成
  15. 阅读说明后勾选复选框,然后单击
  16. 向导将开始创建高可用性集群。所需时间将根据具体环境而有所不同。
    • 在集群创建过程中,请勿关闭主服务器或备用服务器。如果在集群创建过程中发生电源故障,则集群会创建失败。
  17. 该过程完成后,您可以通过新的集群主机名和 IP 地址访问数据和服务。
    9.png

注意:

  • 您可以使用 Synology Assistant 通过搜索 Synology NAS 来检查集群的状态。创建集群后,您只能查看集群主机名和集群 IP 地址。
  • 您可以通过集群主机名或集群 IP 地址访问共享文件夹和服务。
  • 创建集群后,备用服务器将不再主动提供服务,而是保持待机模式。
  • 您可以在 Synology High Availability 中管理集群。请参阅第 4 章:在 SHA 用户界面中导航以了解更多信息。

使用已在使用的 Synology NAS 创建集群

本节介绍使用已在使用的 Synology NAS 创建高可用性集群的过程。

例如,您已拥有一台 Synology DS1621+。在该设备使用一段时间后,您需要购买另一台全新的 DS1621+ 来创建高可用性集群。

使用已在使用的 Synology NAS 创建高可用性集群的过程与使用两台新的 Synology NAS 创建集群大致相同。但是,需要记住一些关键差异:

  1. 确保现有环境满足第 2 章:所需环境中规定的要求。
  2. Synology High Availability 不支持使用 SHR (Synology Hybrid RAID) 实施的 Synology NAS。如果您已在现有 Synology NAS 上设置了 SHR,请确保先移除 SHR 存储池,然后再继续创建高可用性集群。SHR 存储池的 RAID 类型不能直接更改为其他非 SHR RAID 类型。请按照以下步骤备份数据,创建其他 RAID 类型的新存储池,然后在新存储池上还原数据。
    1. 备份存储池
    2. 前往存储管理器 > 存储并选择要移除的 SHR 存储池。
    3. 单击移除
    4. 创建新存储池并选择非 SHR RAID 类型。有关说明,请参阅 DSM 7.x 和 DSM 6.2 的相应帮助文章。
    5. 创建一个或多个新存储空间。有关说明,请参阅 DSM 7.x 和 DSM 6.2 的相应帮助文章。
    6. 将备份的数据还原到新创建的存储池和存储空间。
  3. 必须在安装 Synology Directory Server 之前创建高可用性集群。如果您已安装了 Synology Directory Server,请先按照以下步骤备份其数据和配置,然后卸载/重新安装该套件。
    1. 使用 Hyper Backup 备份 Synology Directory Server。有关更多说明,请参阅 DSM 7.x 和 DSM 6.2 的相应文章。
    2. 前往套件中心并卸载 Synology Directory Server
    3. 创建高可用性集群。
    4. 重新安装 Synology Directory Server 并使用 Hyper Backup 还原套件数据和配置。有关说明,请参阅 DSM 7.x 和 DSM 6.2 的相应帮助文章。
  4. 创建集群后,您会重定向到主页,系统会执行初始同步。主服务器上的所有数据都会完整同步到备用服务器。
    10.png

注意:

  • 请勿使用主服务器的原始主机名或 IP 地址访问 Synology NAS。如果在故障转移后服务已转移到另一台服务器,则原始主服务器会成为备用服务器。如果您继续使用原始设备的主机名或 IP 地址,则在发生故障转移时会无法访问设备的服务。

将备用服务器添加到现有集群

本节介绍将备用服务器添加到现有集群的过程。例如,当前已在使用的主服务器和要添加到集群的备用服务器都是 DS1621+。这些服务器将分别称为服务器 A 和服务器 B。

  1. 请参阅使用两台新的 Synology NAS 创建集群中的步骤 1-4 来设置备用服务器(服务器 B)。
  2. 使用属于 administrators 群组的帐户登录主服务器。
  3. 打开 Synology High Availability
  4. 单击 + 以添加备用服务器。
    11.png
  5. 单击以打开集群创建向导。在集群创建过程中,主服务器上的服务会继续运行。
  6. 请仔细阅读开始之前的准备页面的内容。确认两台服务器的配置满足要求后,单击下一步
  7. 集群接口和 Heartbeat 接口会基于现有主服务器的设置。如果要更改集群或 Heartbeat 接口,则必须先移除高可用性集群,重新配置两台主机的网络设置,然后重新创建高可用性集群。单击下一步
  8. 输入属于备用服务器上 administrators 群组的帐户凭据。单击下一步
  9. 向导将检查系统是否满足要求。完成后单击下一步
  10. 确认设置并单击完成
  11. 阅读说明后勾选复选框,然后单击
  12. 向导将开始创建高可用性集群。所需时间将根据具体环境而有所不同。
    • 在添加备用服务器的过程中,请勿关闭主服务器或备用服务器。如果在集群创建过程中发生电源故障,则集群会创建失败。
  13. 完成后,您会重定向到主页。集群状态会显示数据正在进行同步。

3.3 测试和模拟

SHA 的故障转移机制是最大程度减少系统故障导致的服务中断的关键。为了确保灾难恢复计划强大且经过测试,可以模拟灾难情形以评估 SHA 设置。

开始之前的准备

  • 确保您已备份了所有重要数据。您的设备可能会在运行测试期间断开连接,这可能会导致数据丢失。
  • 使用集群 IP 地址登录 DSM。不建议使用主服务器 IP 地址进行登录,而备用服务器 IP 地址不可用。
  • 如果在测试过程中发生导致集群或服务器被移除的问题,则您可以使用主服务器的 IP 地址再次登录 DSM。

手动切换和自动故障转移

可以手动触发切换以进行系统维护,几乎不会造成服务中断。自动故障转移可被各种事件触发。发生某些错误(如网络不可用、软件错误、硬盘损坏、RAID 损坏等)时,系统可以自动启动将服务从主服务器故障转移到备用服务器,以尽可能地提高可用性。

若要触发切换:

集群页面上,确认集群的状态为良好,然后单击管理 > 切换。集群中的服务器应交换角色:原始主服务器会承担备用服务器的角色,而原始备用服务器会接管服务的提供以成为主服务器。

若要触发自动故障转移:

集群页面上,确认集群的状态为良好,然后重新创建以下事件之一以引发错误并触发自动故障转移:

  • 从主服务器中移除电源以模拟断电。
  • 断开主服务器与集群连接的连接以模拟网络故障。请勿断开 Heartbeat 连接。

有关如何手动启动切换、触发自动故障转移或模拟连接问题的分步说明,请参阅如何测试 Synology High Availability 集群的功能

Split-brain 错误模拟和解决方案

当 Heartbeat 与集群连接之间的连接中断时,会发生 split-brain 错误。主服务器和备用服务器都会尝试承担主服务器的角色,从而导致“split-brain”。这可能会导致服务器上数据不一致,必须尽快解决。有关 split-brain 的更多信息,请参阅 Split-brain 一节(第 4 章:在 SHA 用户界面中导航)。

本节演示如何测试和解决 split-brain 错误。由于测试过程会影响集群的状态,因此建议您在集群未提供服务时执行此操作。

进入安全模式(Split-brain 模式)

  1. 前往控制面板 > 共享文件夹以创建共享文件夹 (Share1)。通过 File Station 将一些测试文件(1.txt 和 2.txt)上传到 Share1
    12.png
  2. 从主服务器 (NAS-A) 上快速拔下所有电缆。服务会暂时不可用。
  3. 系统会注意到主服务器 (NAS-A) 不可用,并自动故障转移到备用服务器 (NAS-B)。备用服务器 (NAS-B) 会成为主服务器并开始提供服务。
  4. 使用高可用性集群 IP 地址登录 NAS-B。高可用性集群状态会显示 NAS-B 为主服务器,而 NAS-A 无法检测。在这种情况下,NAS-A 和 NAS-B 都充当主服务器。1
    13.png
  5. 对 NAS-B 的共享文件夹 Share1 中的数据进行一些更改,以在每台服务器上的文件之间形成差异(数据不一致)。
  6. 大约十分钟后,重新连接 NAS-A 的 Heartbeat 接口和主集群接口网线。重新连接了 NAS-A 和 NAS-B 后,系统会开始整合数据。当系统发现数据不一致(split-brain 错误)时,高可用性集群会进入安全模式。
    14.png
  7. 等待一段时间后,通过一台服务器的 IP 地址登录 DSM (NAS-A)。您会看到高可用性集群状态显示 Split-brain 错误

注意:

  1. 如果您未看到 split-brain 错误状态,则表示模拟失败。重新插入设备并按照本节开头的步骤重试。

解决 split-brain 错误

  1. 通过集群 IP 地址登录 DSM (NAS-A)。
  2. 两台服务器上的服务和高可用性集群的 IP 地址在 split-brain 错误解决之前无法使用。
  3. 一个名为 Split-brain 的新选项卡会在左侧面板中出现。在此选项卡上,会显示两台服务器上共享文件夹中文件之间的差异以及服务器成为主服务器的时间。从右侧的下拉菜单中选择要比较的共享文件夹。
    15.png
  4. File Station 将处于只读模式,但您仍可下载或查看文件。
  5. 集群选项卡中,可以通过单击管理按钮来关闭集群或解决 split-brain 错误。有两个可用选项。有关更多详细信息,请参阅 Split-brain 一节(第 4 章:在 SHA 用户界面中导航)。
  6. 选择只保留其中一台服务器的数据,然后选择 NAS-B 作为新的主服务器
  7. 完成设置应用。几分钟后,您会重定向到集群页面,并且集群状态会显示数据正在进行同步。
  8. 同步完成后,您可前往 File Station 再次检查 Share1 的数据是否包含最新数据。

3.4 为 SHA 设置存储

开始之前的准备

SHA 使用的存储池和文件系统基于高可用性。本用户指南使用基于 SHA 最低要求的以下示例:

  • HDD:2
  • 存储池:RAID-1
  • 存储空间/文件系统:Btrfs

注意:

  • 仅支持 RAID 1、RAID 5、RAID 6、RAID 10、RAID F1 和 BASIC。
  • 请安装全新硬盘,因为使用过的硬盘可能会遇到意外问题。
  • 主服务器和备用服务器上的存储设置会进行同步,以便两台服务器上的设置相同。
  • Peta Volume 仅在使用 DSM 7.1 或以上版本新安装的 Synology NAS 上受支持。

存储设置

  1. 使用集群 IP 地址登录 DSM 并前往存储管理器
  2. 前往存储,然后单击立即创建 > 开始
    16.png
  3. 配置存储池属性并选择 RAID 1 作为 RAID 类型
    17.png
  4. 选择并部署两个硬盘,然后单击下一步
    18.png
  5. 选择执行硬盘检查,然后单击下一步
    19.png
  6. 分配容量大小,然后单击下一步
  7. 选择 Btrfs 作为文件系统,然后单击下一步有关文件系统的更多信息
    20.png
  8. 确认设置并单击应用
  9. 单击确定以完成存储池创建。
  10. 如果要创建第二个存储池或存储空间,请单击创建

3.5 监控的服务

选择您要使用 Synology High Availability 监控的服务。如果监控的服务在主服务器上发生故障,系统将故障转移至备用服务器(备用服务器运行正常的情况下)。
21.png

3.6 仲裁服务器

仲裁服务器有助于降低 split-brain 错误发生的可能性。在服务页面上,您可将会持续连接至主服务器和备用服务器的另一台服务器指定为仲裁服务器。网关服务器或 DNS 服务器都是合适的仲裁服务器示例,因为它们能够连接到主服务器和备用服务器。仲裁服务器只需提供 Ping 服务,因此无需安装任何应用程序。

仲裁服务器允许出现以下情况:

  • 如果备用服务器无法同时连接至主服务器和仲裁服务器,则不会执行故障转移以防止 split-brain 错误。
  • 如果主服务器无法连接至仲裁服务器而备用服务器能够连接,则会触发切换以确保更好的可用性。

设置仲裁服务器

  1. 前往 Synology High Availability > 服务
  2. 勾选启用仲裁服务器并输入仲裁服务器的 IP 地址。
    22.png
  3. 确保仲裁服务器始终连接到主服务器和备用服务器。
  4. 单击测试连接以确保仲裁服务器已正确连接。
  5. 单击应用

3.7 UPS

SHA 集群允许您为每台设备设置不间断电源 (UPS)。如果出现电源故障,则主服务器和备用服务器会进入安全模式,以降低功耗并防止数据丢失。根据您的需要,您还可以为每台服务器使用不同类型的 UPS。

SHA 支持以下三种 UPS 类型:

  • SNMP UPS
  • USB UPS
  • Synology UPS 服务器

SHA UPS 行为

建议对集群中的每台服务器使用不同的电源来设置 UPS。您可以根据设备的要求选择合适的 UPS 类型。如果电源出现问题,则 UPS 会帮助防止 Synology NAS 意外关闭。
23.png

如果服务器遇到电源问题,主服务器会在达到指定等待时间后进入安全模式。系统随后会将服务切换到备用服务器,以便它们可以不间断地运行。

如果备用服务器遇到电源问题,则备用服务器会单独进入安全模式,而不会影响主服务器上的服务。解决电源问题后,备用服务器会自动重新启动并返回集群以继续同步数据。

如果您的环境不允许使用不同的电源或连接不同的 UPS,您可以将任何类型的 UPS 连接到其中一台服务器。例如,将主服务器或备用服务器连接到 UPS。如果发生电源中断,则连接到 UPS 的服务器会收到电源故障通知,并将通知转发给未连接到 UPS 的服务器。两台服务器随后都会进入安全模式,直至电源恢复。它们随后会自动重新启动以继续提供高可用性服务。

SHA UPS 配置

如果两台服务器连接到同一个网络交换机

将服务器连接到与网络交换机相同的电源,并设置任何类型的 UPS(USB UPS/SNMP UPS/Synology UPS 服务器)作为电源保护。

如果您使用 USB UPS,请将通信终端连接到其中一台服务器。该服务器会充当主要接收端点。在这种情况下,如果发生电源故障,则整个集群会进入安全模式。

如果您使用 SNMP UPS 或 Synology UPS 服务器,您可以将一台或两台服务器连接到同一个 UPS。在这种情况下,如果发生电源故障,则两台服务器都会进入安全模式。

0.086517s