17.08.2015 Views

Veritas Storage Foundation™ and High Availability ... - Symantec

Veritas Storage Foundation™ and High Availability ... - Symantec

Veritas Storage Foundation™ and High Availability ... - Symantec

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Veritas</strong> <strong>Storage</strong> Foundation<strong>and</strong> <strong>High</strong> <strong>Availability</strong>Solutions 故 障 排 除 指 南HP-UX6.0.1


<strong>Symantec</strong> Corporation350 Ellis StreetMountain View, CA 94043http://www.symantec.com


技 术 支 持<strong>Symantec</strong> 技 术 支 持 具 有 全 球 性 支 持 中 心 。 技 术 支 持 的 主 要 任 务 是 响 应 有 关 产 品 特性 和 功 能 的 特 定 查 询 。 技 术 支 持 小 组 还 负 责 编 写 我 们 的 联 机 知 识 库 文 章 。 技 术 支 持小 组 与 <strong>Symantec</strong> 内 的 其 他 职 能 部 门 相 互 协 作 , 及 时 解 答 您 的 问 题 。 例 如 , 技 术 支持 小 组 与 产 品 工 程 和 <strong>Symantec</strong> 安 全 响 应 中 心 协 作 , 提 供 警 报 服 务 和 病 毒 定 义 更 新服 务 。<strong>Symantec</strong> 提 供 的 维 护 服 务 包 括 :■■■■一 系 列 支 持 服 务 , 使 您 能 为 任 何 规 模 的 单 位 选 择 适 用 的 支 持 服 务通 过 电 话 和 Web 支 持 快 速 响 应 并 提 供 最 新 信 息升 级 保 证 可 保 证 软 件 顺 利 升 级全 天 候 提 供 全 球 支 持■ 高 级 功 能 , 包 括 “ 客 户 管 理 服 务 ”有 关 <strong>Symantec</strong> 维 护 计 划 的 更 多 信 息 , 请 访 问 我 们 的 网 站 :http://www.symantec.com/zh/cn/support/index.jsp与 技 术 支 持 联 系具 有 有 效 维 护 协 议 的 客 户 可 以 通 过 以 下 网 址 访 问 技 术 支 持 信 息 :http://www.symantec.com/zh/cn/support/index.jsp在 联 系 技 术 支 持 之 前 , 请 确 保 您 的 计 算 机 符 合 产 品 文 档 中 所 列 的 系 统 要 求 。 而 且 您应 当 坐 在 发 生 问 题 的 计 算 机 旁 边 , 以 便 需 要 时 重 现 问 题 。联 系 技 术 支 持 时 , 请 准 备 好 以 下 信 息 :■■■■■■■产 品 版 本 信 息硬 件 信 息可 用 内 存 、 磁 盘 空 间 和 NIC 网 卡 信 息操 作 系 统版 本 和 补 丁 程 序 级 别网 络 结 构路 由 器 、 网 关 和 IP 地 址 信 息■ 问 题 说 明 :■错 误 消 息 和 日 志 文 件■ 联 系 <strong>Symantec</strong> 之 前 执 行 过 的 故 障 排 除 操 作


■最 近 所 做 的 软 件 配 置 更 改 和 网 络 更 改授 权 许 可 与 产 品 注 册如 果 您 的 <strong>Symantec</strong> 产 品 需 要 注 册 或 许 可 证 密 钥 , 请 访 问 我 们 的 技 术 支 持 网 页 :https://licensing.symantec.com/客 户 服 务可 从 以 下 网 站 获 得 客 户 服 务 信 息 :http://www.symantec.com/zh/cn/support/index.jsp客 户 服 务 可 帮 助 您 解 决 一 些 非 技 术 性 问 题 , 例 如 以 下 几 类 问 题 :■ 有 关 产 品 许 可 或 序 列 号 的 问 题■ 产 品 注 册 更 新 ( 例 如 , 更 改 地 址 或 名 称 )■ 一 般 产 品 信 息 ( 功 能 、 可 用 的 语 言 、 当 地 经 销 商 )■■■■■■有 关 产 品 更 新 和 升 级 的 最 新 信 息有 关 升 级 保 障 和 维 护 合 同 的 信 息<strong>Symantec</strong> 采 购 计 划 的 相 关 信 息有 关 <strong>Symantec</strong> 技 术 支 持 选 项 的 建 议非 技 术 性 的 售 前 问 题与 光 盘 或 手 册 相 关 的 问 题维 护 协 议 资 源如 果 想 就 现 有 维 护 协 议 事 宜 联 络 <strong>Symantec</strong>, 请 通 过 以 下 方 式 联 络 您 所 在 地 区 的 维护 协 议 管 理 部 门 :国 家 / 地 区中 国 大 陆中 国 台 湾中 国 香 港 特 别 行 政 区销 售 热 线800 810 88260080 1611 391800 963 421电 子 邮 件China-Sales@symantec.comTaiwan-Sales@symantec.comHongKong-Sales@symantec.com文 档介 质 中 提 供 了 PDF 格 式 的 产 品 指 南 。 请 确 保 您 使 用 的 是 文 档 的 最 新 版 本 。 每 个 指 南的 第 2 页 上 提 供 了 文 档 版 本 信 息 。 从 <strong>Symantec</strong> 网 站 可 以 获 取 最 新 的 产 品 文 档 。https://sort.symantec.com/documents


关 于 <strong>Symantec</strong> Connect您 对 产 品 文 档 的 反 馈 对 我 们 很 重 要 。 请 发 送 改 进 建 议 和 有 关 错 误 或 疏 漏 的 报 告 。 请在 您 的 报 告 中 包 括 所 报 告 的 文 本 内 容 的 文 档 标 题 和 文 档 版 本 ( 位 于 第 二 页 上 ) 以 及章 节 标 题 。 请 将 反 馈 发 送 到 :doc_feedback@symantec.com如 需 最 新 HOWTO 文 章 、 文 档 更 新 的 信 息 , 或 询 问 有 关 产 品 文 档 的 问 题 , 请 访 问<strong>Symantec</strong> Connect 上 的 <strong>Storage</strong> <strong>and</strong> Clustering Documentation( 存 储 和 集 群 文档 ) 论 坛 。https://www-secure.symantec.com/connect/storage-management/forums/storage-<strong>and</strong>-clustering-documentation<strong>Symantec</strong> Connect 是 为 <strong>Symantec</strong> 企 业 客 户 提 供 的 点 对 点 技 术 社 区 网 站 。 参 与 者可 以 与 其 他 产 品 用 户 联 络 并 共 享 信 息 , 包 括 发 布 论 坛 帖 子 、 文 章 、 视 频 、 下 载 、 博客 和 提 出 建 议 , 并 可 与 <strong>Symantec</strong> 产 品 团 队 和 技 术 支 持 进 行 交 流 。 内 容 会 由 社 区 进行 评 分 , 成 员 可 凭 其 贡 献 获 得 奖 励 积 分 。http://www.symantec.com/connect/storage-management


目 录技 术 支 持 ............................................................................................................... 4第 1 章 简 介 ........................................................................................ 13关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong> <strong>Availability</strong> Solutions 产品 故 障 排 除 ............................................................................ 13关 于 <strong>Symantec</strong> Operations Readiness Tools ...................................... 13用 于 收 集 VxExplorer 故 障 排 除 存 档 的 增 强 功 能 ............................. 14关 于 SORT 数 据 收 集 器 ............................................................. 15关 于 唯 一 消 息 标 识 符 ...................................................................... 15使 用 <strong>Symantec</strong> Operations Readiness Tools 查 找 唯 一 消 息 标 识 符说 明 和 解 决 方 案 ................................................................ 15部 分 1 <strong>Veritas</strong> File System 故 障 排 除 .............................. 17第 2 章 诊 断 消 息 ............................................................................... 19文 件 系 统 对 问 题 的 响 应 ................................................................... 19恢 复 禁 用 的 文 件 系 统 ................................................................ 20关 于 内 核 消 息 ............................................................................... 20部 分 2 <strong>Veritas</strong> Volume Manager 故 障 排 除 ................. 21第 3 章 硬 件 故 障 后 恢 复 .................................................................. 23关 于 硬 件 故 障 后 恢 复 ...................................................................... 23列 出 不 可 启 动 的 卷 ......................................................................... 24显 示 卷 和 Plex 状 态 ........................................................................ 24Plex 状 态 循 环 .............................................................................. 25恢 复 不 可 启 动 的 镜 像 卷 ................................................................... 28恢 复 不 可 启 动 的 卷 ( 其 中 禁 用 的 Plex 为 RECOVER 状 态 ) ..................... 28强 制 重 新 启 动 禁 用 的 卷 ................................................................... 29清 除 磁 盘 上 的 failing 标 志 ............................................................... 30重 新 挂 接 出 错 的 磁 盘 ...................................................................... 31在 Plex 挂 接 或 同 步 操 作 失 败 后 恢 复 .................................................. 31RAID-5 卷 上 的 故 障 ....................................................................... 32


8目 录系 统 故 障 ............................................................................... 32磁 盘 故 障 ............................................................................... 33RAID-5 的 默 认 启 动 恢 复 过 程 ..................................................... 34恢 复 RAID-5 卷 ...................................................................... 35在 移 动 RAID-5 子 磁 盘 后 恢 复 .................................................... 37不 可 启 动 的 RAID-5 卷 ............................................................. 38在 不 完 整 的 磁 盘 组 移 动 后 恢 复 .......................................................... 40在 DCO 卷 出 现 故 障 后 恢 复 .............................................................. 40恢 复 0 版 DCO 卷 .................................................................... 42恢 复 即 时 快 照 DCO 卷 ( 版 本 20 或 更 高 版 本 ) ............................... 45第 4 章 在 即 时 快 照 故 障 后 恢 复 ..................................................... 47在 vxsnap prepare 失 败 后 恢 复 ........................................................ 47在 对 完 整 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复 ........................... 48在 对 断 开 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复 ................................. 48在 对 优 化 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复 ........................... 49在 vxsnap restore 失 败 后 恢 复 ......................................................... 49在 vxsnap refresh 失 败 后 恢 复 ......................................................... 49在 “ 写 入 时 复 制 ” 失 败 后 恢 复 ............................................................. 50发 生 重 新 同 步 I/O 错 误 后 恢 复 .......................................................... 50DCO 卷 发 生 I/O 故 障 后 恢 复 ............................................................ 51从 对 即 时 快 照 数 据 更 改 对 象 (DCO) 执 行 vxsnap upgrade 时 出 现 的 故 障中 恢 复 .................................................................................. 51第 5 章 在 引 导 磁 盘 故 障 后 恢 复 ..................................................... 53VxVM 和 引 导 磁 盘 故 障 ................................................................... 53通 过 从 VxVM 根 磁 盘 镜 像 引 导 恢 复 系 统 ............................................. 53恢 复 VxVM 引 导 磁 盘 采 用 本 机 多 径 处 理 的 系 统 .................................... 54通 过 从 恢 复 介 质 引 导 来 恢 复 系 统 ....................................................... 55从 恢 复 介 质 引 导 后 启 动 VxVM .................................................... 56在 VxVM 紧 急 启 动 后 恢 复 根 卷 ................................................... 57修 复 丢 失 或 损 坏 的 /etc/vx/volboot 文 件 ...................................... 57启 动 VxVM 维 护 模 式 引 导 ............................................................... 58通 过 重 新 安 装 来 恢 复 ...................................................................... 59第 6 章 管 理 命 令 和 事 务 .................................................................. 61命 令 日 志 ..................................................................................... 61事 务 日 志 ..................................................................................... 63命 令 日 志 和 事 务 日 志 的 关 联 ............................................................. 64将 从 从 属 节 点 发 出 的 CVM 命 令 关 联 到 主 节 点 ...................................... 65未 启 用 命 令 完 成 ............................................................................ 67


10目 录部 分 3 Dynamic Multi-Pathing 故 障 排 除 ................... 109第 12 章 Dynamic Multi-Pathing 故 障 排 除 .................................. 111降 级 阵 列 支 持 ............................................................................. 111部 分 4第 13 章<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster FileSystem <strong>High</strong> <strong>Availability</strong> 故 障 排 除 .......... 113<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System<strong>High</strong> <strong>Availability</strong> 故 障 排 除 ........................................ 115关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong>故 障 排 除 ............................................................................. 115CFS 故 障 排 除 ............................................................................. 115root 用 户 的 路 径 中 的 顺 序 不 正 确 ................................ 116非 root 用 户 运 行 CFS 命 令 时 CFS 命 令 可 能 会 挂 起 (2403263) .......... 116防 护 配 置 故 障 排 除 ....................................................................... 117已 有 网 络 分 裂 ( 裂 脑 ) 的 示 例 .................................................. 117从 已 有 网 络 分 裂 ( 裂 脑 ) 中 恢 复 ............................................... 118对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排除 ...................................................................................... 119将 节 点 添 加 到 SFHA Solutions 集 群 后 ,CVM 组 仍 处 于 脱 机 状态 ................................................................................ 119在 SFHA Solutions 集 群 中 无 法 导 入 共 享 磁 盘 组 ........................... 120在 SFHA Solutions 集 群 中 导 入 共 享 磁 盘 组 出 错 ........................... 121无 法 在 SFHA Solutions 集 群 中 启 动 CVM ................................... 121即 使 CVMCluster 在 SFHA Solutions 集 群 中 处 于 联 机 状 态 ,CVMVolDg 也 不 联 机 ....................................................... 121部 分 5 <strong>Veritas</strong> Cluster Server 故 障 排 除 ...................... 123第 14 章 VCS 的 故 障 排 除 与 恢 复 .................................................... 125VCS 消 息 日 志 记 录 ....................................................................... 125GAB 消 息 日 志 记 录 ................................................................ 127为 代 理 启 用 调 试 日 志 .............................................................. 127启 用 IMF 的 调 试 日 志 ............................................................. 128对 VCS 引 擎 启 用 调 试 日 志 ....................................................... 129关 于 调 试 日 志 标 记 用 法 ........................................................... 129收 集 VCS 信 息 以 进 行 支 持 分 析 ................................................. 130收 集 LLT 和 GAB 信 息 以 进 行 支 持 分 析 ....................................... 131


目 录11收 集 IMF 信 息 以 进 行 支 持 分 析 ................................................. 132消 息 目 录 ............................................................................. 132VCS 引 擎 故 障 排 除 ....................................................................... 133HAD 诊 断 ............................................................................ 133HAD 连 续 重 新 启 动 ................................................................ 134DNS 配 置 问 题 导 致 GAB 终 止 HAD ............................................ 134种 子 设 定 和 I/O 防 护 .............................................................. 134联 机 前 IP 检 查 ...................................................................... 135Low Latency Transport (LLT) 故 障 排 除 ........................................... 135LLT 启 动 脚 本 显 示 错 误 ........................................................... 135LLT 检 测 到 使 用 了 交 叉 链 路 ..................................................... 136LLT 链 路 状 态 消 息 ................................................................. 136Group Membership Services/Atomic Broadcast (GAB) 故 障 排 除 .......... 138端 口 在 重 新 打 开 时 出 现 延 迟 ..................................................... 138由 于 客 户 端 进 程 故 障 , 导 致 节 点 混 乱 ......................................... 139VCS 启 动 故 障 排 除 ....................................................................... 139VCS:10622 local configuration missing ..................................... 139VCS:10623 local configuration invalid ...................................... 140VCS:11032 registration failed.Exiting ....................................... 140Waiting for cluster membership. ............................................. 140智 能 监 视 框 架 (IMF) 故 障 排 除 ........................................................ 140疑 难 解 答 服 务 组 .......................................................................... 142VCS 不 会 自 动 启 动 服 务 组 ........................................................ 142系 统 未 处 于 RUNNING 状 态 ..................................................... 142服 务 组 未 配 置 为 在 该 系 统 上 运 行 ............................................... 142服 务 组 未 配 置 为 自 动 启 动 ........................................................ 143服 务 组 已 冻 结 ....................................................................... 143故 障 转 移 服 务 组 在 另 一 个 系 统 上 处 于 联 机 状 态 ............................. 143某 个 关 键 资 源 出 现 故 障 ........................................................... 143已 自 动 禁 用 服 务 组 ................................................................. 143服 务 组 正 在 等 待 资 源 联 机 / 脱 机 ................................................. 144服 务 组 正 在 等 待 某 个 依 赖 关 系 得 到 满 足 ...................................... 144未 完 全 探 查 到 服 务 组 .............................................................. 144疑 难 解 答 资 源 ............................................................................. 145由 于 故 障 转 移 而 使 服 务 组 联 机 .................................................. 145正 在 等 待 服 务 组 状 态 .............................................................. 145正 在 等 待 子 资 源 .................................................................... 145正 在 等 待 父 资 源 .................................................................... 145正 在 等 待 资 源 响 应 ................................................................. 145代 理 未 运 行 .......................................................................... 145磁 盘 组 代 理 的 Monitor 入 口 点 返 回 ONLINE, 即 使 磁 盘 组 已 被 禁用 也 是 如 此 .................................................................... 146I/O 防 护 故 障 排 除 ........................................................................ 146


12目 录正 在 逐 出 某 个 节 点 时 , 另 一 个 节 点 不 能 加 入 集 群 .......................... 147当 SCSI TEST UNIT READY 命 令 失 败 时 ,vxfentsthdw 实 用 程 序将 失 败 .......................................................................... 147手 动 删 除 SCSI-3 磁 盘 中 的 现 有 键 .............................................. 147为 防 止 潜 在 数 据 损 坏 , 系 统 发 生 混 乱 ......................................... 149协 调 器 磁 盘 的 I/O 防 护 键 上 的 集 群 ID 与 本 地 集 群 的 ID 不 匹配 ................................................................................ 153防 护 启 动 报 告 已 有 的 裂 脑 ........................................................ 154注 册 键 会 在 协 调 器 磁 盘 中 丢 失 .................................................. 156集 群 脱 机 时 替 换 损 坏 的 磁 盘 ..................................................... 157如 果 rcp 命 令 或 scp 命 令 不 能 正 常 运 行 ,vxfenswap 实 用 程 序 会退 出 ............................................................................. 159CP 服 务 器 故 障 排 除 ................................................................ 159SFHA Solutions 集 群 节 点 上 基 于 服 务 器 的 防 护 的 故 障 排 除 ............. 160协 调 点 联 机 迁 移 期 间 发 生 的 问 题 ............................................... 161疑 难 解 答 通 知 ............................................................................. 162已 配 置 通 知 程 序 , 但 在 SNMP 控 制 台 上 看 不 到 陷 阱 ...................... 162全 局 集 群 的 故 障 排 除 与 恢 复 ........................................................... 162灾 难 声 明 ............................................................................. 162丢 失 的 心 跳 和 查 询 机 制 ........................................................... 163VCS 警 报 ............................................................................. 163对 steward 进 程 进 行 故 障 排 除 ........................................................ 165授 权 许 可 故 障 排 除 ....................................................................... 165验 证 许 可 证 密 钥 .................................................................... 166授 权 错 误 消 息 ....................................................................... 166索 引 .................................................................................................................... 169


1简 介本 章 节 包 括 下 列 主 题 :■■■关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong> <strong>Availability</strong> Solutions 产 品 故 障 排除关 于 <strong>Symantec</strong> Operations Readiness Tools关 于 唯 一 消 息 标 识 符关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong> <strong>Availability</strong>Solutions 产 品 故 障 排 除本 文 档 介 绍 在 使 用 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong> <strong>Availability</strong> Solutions 时可 能 会 出 现 的 常 见 问 题 并 提 供 针 对 这 些 问 题 的 可 能 解 决 方 案 。 除 了 本 文 档 中 的 故 障排 除 信 息 之 外 , 还 可 以 参 见 相 应 的 <strong>Symantec</strong> 产 品 “ 版 本 说 明 ” 文 档 以 了 解 已 知 问题 和 软 件 限 制 。关 于 <strong>Symantec</strong> Operations Readiness Tools<strong>Symantec</strong> Operations Readiness Tools (SORT) 是 一 个 网 站 , 可 自 动 处 理 和 简 化 某些 最 耗 时 的 管 理 任 务 。SORT 有 助 于 您 更 高 效 地 管 理 数 据 中 心 , 并 充 分 利 用 <strong>Symantec</strong>产 品 。SORT 可 以 帮 助 您 执 行 以 下 操 作 :


14简 介关 于 <strong>Symantec</strong> Operations Readiness Tools为 下 一 次 安 装 或 升 级 做 准备■■列 出 产 品 安 装 和 升 级 要 求 , 包 括 操 作 系 统 版 本 、 内 存 、 磁 盘 空间 和 体 系 结 构 。分 析 系 统 以 确 定 是 否 已 做 好 安 装 或 升 级 <strong>Symantec</strong> 产 品 的 准备 。■ 从 中 央 储 存 库 下 载 最 新 的 修 补 程 序 、 文 档 和 高 可 用 性 代 理 。■ 访 问 硬 件 、 软 件 、 数 据 库 和 操 作 系 统 的 最 新 兼 容 性 列 表 。管 理 风 险提 高 效 率■从 中 央 储 存 库 获 取 有 关 对 修 补 程 序 、 阵 列 特 定 模 块(ASL/APM/DDI/DDL) 和 高 可 用 性 代 理 所 做 更 改 的 自 动 电 子 邮件 通 知 。■ 确 定 并 降 低 系 统 和 环 境 风 险 。■ 显 示 数 百 个 <strong>Symantec</strong> 错 误 代 码 的 说 明 和 解 决 方 案 。■ 根 据 产 品 版 本 和 平 台 查 找 并 下 载 修 补 程 序 。■ 列 出 已 安 装 的 <strong>Symantec</strong> 产 品 和 许 可 证 密 钥 。■ 调 整 并 优 化 您 的 环 境 。注 意 :SORT 的 某 些 功 能 并 非 对 所 有 产 品 都 可 用 。 访 问 SORT 不 需 要 额 外 费 用 。要 访 问 SORT, 请 转 到 :https://sort.symantec.com用 于 收 集 VxExplorer 故 障 排 除 存 档 的 增 强 功 能SORT 数 据 收 集 器 包 含 收 集 和 提 交 VxExplorer 存 档 的 功 能 。 您 可 以 将 此 存 档 发 送 给<strong>Symantec</strong> 技 术 支 持 以 便 诊 断 并 排 除 故 障 。VxExplorer 不 收 集 客 户 数 据 。旧 VxExplorer 脚 本 已 废 弃 , 因 此 未 在 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong><strong>Availability</strong> Solutions 6.0.1 版 本 中 提 供 。您 可 以 使 用 SORT 数 据 收 集 器 选 择 性 地 执 行 下 列 操 作 :■使 用 基 于 操 作 系 统 的 远 程 Shell (RSH) 或 安 全 Shell (SSH) 远 程 功 能 从 多 台 服 务器 收 集 VxExplorer 数 据 。■ 将 数 据 自 动 上 传 到 ftp.veritas.com 的 /incoming 目 录 。■■确 定 指 定 服 务 器 是 否 为 集 群 的 一 部 分 , 并 将 其 他 集 群 节 点 添 加 到 数 据 收集 /VxExplorer 进 程 ( 部 分 集 群 检 查 )。自 动 升 级 数 据 收 集 器 脚 本 。 如 果 服 务 器 没 有 Internet 连 接 , 则 会 自 动 禁 用 此 功能 。 您 还 可 以 通 过 更 新 sortdc.conf 配 置 文 件 来 手 动 禁 用 自 动 升 级 。


简 介关 于 唯 一 消 息 标 识 符15关 于 SORT 数 据 收 集 器SORT 数 据 收 集 器 包 含 在 VRTSspt 软 件 包 中 , 并 在 安 装 SFHA Solutions 时 安 装 在系 统 上 。标 准 数 据 收 集 器 功 能 包 括 下 列 功 能 :■ 采 用 可 读 的 标 准 Perl 脚 本 编 写 。■ 使 用 同 一 工 具 生 成 SORT 自 定 义 报 告 并 收 集 VxExplorer 存 档 。■数 据 收 集 器 日 志 和 SFHA Solutions 安 装 日 志 具 有 相 同 格 式 。 数 据 收 集 器 日 志 存储 在 ~/sort/log/ 目 录 中 。要 了 解 有 关 使 用 数 据 收 集 器 收 集 VxExplorer 存 档 的 详 细 信 息 , 请 参 见 :http://www.symantec.com/docs/HOWTO32575关 于 唯 一 消 息 标 识 符<strong>Symantec</strong> 企 业 产 品 会 显 示 唯 一 消 息 标 识 符 (UMI) 消 息 代 码 。UMI 包 括 错 误 、 警 告和 信 息 性 消 息 。 如 果 您 收 到 UMI, 可 以 使 用 <strong>Symantec</strong> Operations Readiness Tools(SORT) 查 找 消 息 说 明 和 解 决 方 案 。请 参 见 第 13 页 的 “ 关 于 <strong>Symantec</strong> Operations Readiness Tools”。请 参 见 第 15 页 的 “ 使 用 <strong>Symantec</strong> Operations Readiness Tools 查 找 唯 一 消 息 标 识符 说 明 和 解 决 方 案 ”。使 用 <strong>Symantec</strong> Operations Readiness Tools 查 找 唯 一 消 息 标 识 符 说 明和 解 决 方 案您 可 以 使 用 <strong>Symantec</strong> Operations Readiness Tools (SORT) 查 找 唯 一 消 息 标 识 符(UMI) 说 明 和 解 决 方 案 。查 找 唯 一 消 息 标 识 符 说 明 和 解 决 方 案1 将 Web 浏 览 器 指 向 以 下 URL:http://sort.symantec.com2 在 任 意 SORT 页 的 “search ( 搜 索 )” 字 段 中 , 输 入 UMI 代 码 , 然 后 单 击 “search( 搜 索 )” 图 标 。


16简 介关 于 唯 一 消 息 标 识 符3 在 “Search Result ( 搜 索 结 果 )” 页 的 “Error codes ( 错 误 代 码 )” 窗 格 中 , 单 击指 向 您 的 消 息 代 码 的 链 接 。 如 果 有 大 量 搜 索 结 果 , 请 使 用 页 面 顶 部 的 复 选 框 只显 示 可 轻 松 查 找 您 的 代 码 的 错 误 代 码 。此 时 将 显 示 UMI 代 码 的 “Error Code details ( 错 误 代 码 详 细 信 息 )” 页 , 其 中提 供 了 说 明 以 及 任 何 可 能 的 解 决 方 案 。4 如 果 该 页 上 的 信 息 未 提 供 适 合 您 问 题 的 解 决 方 案 , 您 可 以 单 击 页 面 上 的 任 一 链接 , 执 行 下 列 操 作 之 一 :■ 对 UMI 或 其 解 决 方 案 进 行 评 论 。■ 请 求 解 决 方 案 。■ 添 加 您 自 己 的 解 决 方 案 。


部 分1<strong>Veritas</strong> File System 故 障 排 除■2. 诊 断 消 息


2诊 断 消 息本 章 节 包 括 下 列 主 题 :■■文 件 系 统 对 问 题 的 响 应关 于 内 核 消 息文 件 系 统 对 问 题 的 响 应当 文 件 系 统 遇 问 题 时 , 它 将 按 下 列 方 式 之 一 进 行 响 应 :标 记 错 误 的 inode禁 用 事 务 处 理禁 用 文 件 系 统如 果 inode 更 新 或 目 录 块 更 新 失 败 , 则 将 Inode 可 以 标 记 为 出 错 。在 这 些 类 型 的 失 败 中 , 文 件 系 统 不 知 道 磁 盘 上 的 具 体 信 息 , 但 会 考虑 它 查 到 所 有 无 效 信 息 。 在 将 inode 标 记 为 出 错 后 , 内 核 仍 然 允 许对 文 件 名 的 访 问 , 但 是 任 何 访 问 文 件 中 的 数 据 或 更 改 inode 的 尝 试均 会 失 败 。如 果 文 件 系 统 在 写 入 意 向 日 志 时 检 测 到 错 误 , 则 它 将 禁 用 事 务 处理 。 禁 用 事 务 处 理 之 后 , 仍 可 以 读 取 或 写 入 文 件 系 统 中 的 文 件 , 但不 允 许 任 何 块 或 inode 释 放 或 分 配 、 结 构 更 改 、 目 录 条 目 更 改 或 其他 对 元 数 据 的 更 改 。如 果 发 生 了 错 误 进 而 损 害 了 文 件 系 统 的 完 整 性 , 则 VxFS 将 禁 用 本身 。 如 果 意 向 日 志 失 败 或 inode 列 表 发 生 错 误 , 超 级 块 通 常 会 更 新( 设 置 VX_FULLFSCK 标 志 ), 以 便 下 一 fsck 执 行 整 个 结 构 检 查 。如 果 此 超 级 块 更 新 失 败 , 任 何 对 文 件 系 统 的 更 改 都 可 能 造 成 不 一致 , 而 意 向 日 志 重 放 无 法 检 查 到 这 些 不 一 致 。 要 避 免 此 情 形 , 文 件系 统 将 禁 用 本 身 。


20诊 断 消 息关 于 内 核 消 息恢 复 禁 用 的 文 件 系 统禁 用 文 件 系 统 后 , 不 能 向 磁 盘 写 入 任 何 数 据 。 尽 管 一 些 次 要 的 文 件 系 统 仍 可 工 作 ,但 是 大 多 数 文 件 系 统 只 返 回 EIO。 禁 用 文 件 系 统 之 后 , 唯 一 可 做 的 事 是 执 行 umount命 令 和 完 全 运 行 fsck。虽 然 日 志 重 放 可 以 生 成 一 个 干 净 的 文 件 系 统 , 但 是 执 行 整 个 结 构 检 查 会 更 安 全 。文 件 系 统 通 常 会 由 于 磁 盘 错 误 而 遭 到 禁 用 。 磁 盘 故 障 将 会 导 致 禁 用 文 件 系 统 , 因此 , 应 尽 快 将 其 修 复 。请 参 见 fsck_vxfs(1M) 手 册 页 。执 行 整 个 结 构 检 查◆ 使 用 fsck 命 令 执 行 整 个 结 构 检 查 :# fsck -F vxfs -o full -y /dev/vx/rdsk/diskgroup/volume警 告 : 运 行 此 命 令 时 , 应 小 心 。 通 过 指 定 -y 选 项 , 所 有 fsck 用 户 提 示 均 以yes 回 答 , 如 果 它 执 行 了 整 个 文 件 系 统 检 查 , 则 会 造 成 不 可 撤 消 的 更 改 。关 于 内 核 消 息内 核 消 息 是 <strong>Veritas</strong> File System (VxFS) 内 核 生 成 的 诊 断 性 或 错 误 消 息 。 每 个 消 息均 有 说 明 和 如 何 处 理 或 改 正 基 本 错 误 的 建 议 。当 VxFS 内 核 消 息 显 示 在 系 统 控 制 台 上 时 , 它 位 于 msgcnt 字 段 显 示 的 数 字 ID 之后 。 此 ID 编 号 随 着 每 个 消 息 实 例 而 增 大 , 以 保 证 在 分 析 文 件 系 统 问 题 时 事 件 的 顺序 是 已 知 的 。还 可 以 将 每 个 消 息 写 入 到 可 在 /var/adm/syslog/syslog.log 文 件 中 查 看 的 内 部 内核 缓 冲 区 。有 些 情 况 下 , 其 他 的 数 据 将 写 入 到 内 核 缓 冲 区 。 例 如 , 如 果 inode 标 记 为 出 错 , 则将 写 入 出 错 的 inode 的 内 容 。 当 错 误 消 息 在 控 制 台 上 显 示 时 , 您 可 以 使 用 唯 一 的 消息 ID 在 /var/adm/syslog/syslog.log 中 查 找 该 消 息 , 并 获 取 其 他 信 息 。


部 分2<strong>Veritas</strong> Volume Manager 故障 排 除■■■■■■■■■3. 硬 件 故 障 后 恢 复4. 在 即 时 快 照 故 障 后 恢 复5. 在 引 导 磁 盘 故 障 后 恢 复6. 管 理 命 令 和 事 务7. 备 份 和 还 原 磁 盘 组 配 置8. 对 磁 盘 组 导 入 问 题 进 行 故 障 排 除9. 从 CDS 错 误 恢 复10. 错 误 消 息11. <strong>Veritas</strong> Volume Replicator 故 障 排 除


3硬 件 故 障 后 恢 复本 章 节 包 括 下 列 主 题 :■■■■■关 于 硬 件 故 障 后 恢 复列 出 不 可 启 动 的 卷显 示 卷 和 Plex 状 态Plex 状 态 循 环恢 复 不 可 启 动 的 镜 像 卷■ 恢 复 不 可 启 动 的 卷 ( 其 中 禁 用 的 Plex 为 RECOVER 状 态 )■■■■■■■强 制 重 新 启 动 禁 用 的 卷清 除 磁 盘 上 的 failing 标 志重 新 挂 接 出 错 的 磁 盘在 Plex 挂 接 或 同 步 操 作 失 败 后 恢 复RAID-5 卷 上 的 故 障在 不 完 整 的 磁 盘 组 移 动 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复关 于 硬 件 故 障 后 恢 复<strong>Symantec</strong> 的 <strong>Veritas</strong> Volume Manager (VxVM) 可 以 保 护 系 统 免 受 磁 盘 和 其 他 硬 件故 障 的 影 响 , 并 帮 助 您 从 这 类 事 件 中 恢 复 。 恢 复 过 程 可 帮 助 您 防 止 因 磁 盘 和 其 他 硬件 故 障 导 致 数 据 丢 失 或 无 法 访 问 系 统 。如 果 一 个 卷 发 生 磁 盘 I/O 故 障 ( 例 如 , 由 于 磁 盘 有 无 法 纠 正 的 错 误 ),VxVM 可 分离 此 故 障 所 涉 及 的 Plex。I/O 在 该 Plex 上 停 止 , 但 在 卷 的 其 他 Plex 上 继 续 。


24硬 件 故 障 后 恢 复列 出 不 可 启 动 的 卷如 果 磁 盘 彻 底 损 坏 ,VxVM 可 将 该 磁 盘 从 所 在 的 磁 盘 组 中 分 离 出 来 。 该 磁 盘 上 的 所有 Plex 都 被 禁 用 。 如 果 分 离 时 磁 盘 上 有 任 何 未 镜 像 的 卷 , 这 些 卷 也 被 禁 用 。注 意 : 明 显 的 磁 盘 故 障 可 能 不 是 由 物 理 磁 盘 介 质 或 磁 盘 控 制 器 中 的 故 障 引 起 的 , 而可 能 是 由 中 间 组 件 或 辅 助 组 件 ( 如 电 缆 、 主 机 总 线 适 配 器 或 电 源 ) 的 故 障 引 起 的 。VxVM 中 的 热 重 定 位 功 能 自 动 检 测 磁 盘 故 障 , 并 用 电 子 邮 件 将 故 障 通 知 给 系 统 管 理员 和 其 他 指 定 用 户 。 热 重 定 位 还 尝 试 使 用 备 用 磁 盘 和 空 闲 磁 盘 空 间 来 还 原 冗 余 , 并保 持 对 镜 像 卷 和 RAID-5 卷 的 访 问 能 力 。有 关 管 理 热 重 定 位 的 详 细 信 息 , 请 参 见 《<strong>Veritas</strong> <strong>Storage</strong> Foundation 管 理 指 南 》。在 引 导 (root) 磁 盘 故 障 后 恢 复 需 要 执 行 特 殊 步 骤 。请 参 见 第 53 页 的 “VxVM 和 引 导 磁 盘 故 障 ”。列 出 不 可 启 动 的 卷不 可 启 动 的 卷 可 能 未 正 确 配 置 或 存 在 其 他 妨 碍 其 启 动 的 错 误 或 情 况 。 要 显 示 不 可 启动 的 卷 , 请 使 用 vxinfo 命 令 。 此 命 令 用 于 显 示 卷 的 可 访 问 性 和 可 用 性 信 息 。列 出 不 可 启 动 的 卷◆ 键 入 以 下 命 令 :# vxinfo [-g diskgroup] [volume ...]以 下 示 例 输 出 表 明 卷 mkting 不 可 启 动 :home fsgen Startedmkting fsgen Unstartablesrc fsgen Startedrootvol root Startedswapvol swap Started显 示 卷 和 Plex 状 态要 显 示 有 关 卷 配 置 ( 包 括 卷 的 状 态 和 卷 的 Plex 的 状 态 ) 的 详 细 信 息 , 请 使 用 vxprint命 令 。


硬 件 故 障 后 恢 复Plex 状 态 循 环25显 示 卷 和 Plex 状 态◆ 键 入 以 下 命 令 :# vxprint [-g diskgroup] -hvt [volume ...]以 下 示 例 显 示 了 一 个 禁 用 的 卷 vol, 它 有 两 个 干 净 的 Plex(vol-01 和vol-02), 每 个 Plex 都 有 一 个 子 磁 盘 :# vxprint -g mydg -hvt volDisk group: mydgV NAME RVG/VSET/CO KSTATE STATE LENGTH READPOL PREFPLEX UTYPEPL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODESD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODESV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODESC NAME PLEX CACHE DISKOFFS LENGTH [COL/]OFF DEVICE MODEDC NAME PARENTVOL LOGVOLSP NAME SNAPVOL DCOv vol - DISABLED ACTIVE 212880 SELECT - fsgenpl vol-01 vol DISABLED CLEAN 212880 CONCAT - RWsd mydg11-01 vol-01 mydg11 0 212880 0 c1t0d0 ENApl vol-02 vol DISABLED CLEAN 212880 CONCAT - RWsd mydg12-01 vol-02 mydg12 0 212880 0 c1t1d0 ENA有 关 Plex 和 卷 可 能 状 态 的 说 明 , 请 参 见 《<strong>Veritas</strong> <strong>Storage</strong> Foundation 管 理 指南 》。Plex 状 态 循 环更 改 Plex 状 态 是 正 常 操 作 的 一 部 分 , 并 不 一 定 表 示 出 现 了 必 须 纠 正 的 异 常 情 况 。 清楚 地 了 解 各 种 Plex 状 态 及 其 相 互 之 间 的 关 系 对 于 正 确 执 行 任 何 恢 复 步 骤 是 十 分 必 要的 。图 3-1 显 示 了 发 生 在 VxVM 中 的 Plex 状 态 之 间 的 主 要 转 换 。


26硬 件 故 障 后 恢 复Plex 状 态 循 环图 3-1主 要 的 Plex 状 态 循 环启 动(vxvol start)PS: 干 净PKS: 已 禁 用PS: 活 动PKS: 已 启 用关 闭(vxvol stop)PS = plex state(Plex 状 态 )PKS = plex kernel state(Plex 内 核 状 态 )有 关 Plex 状 态 的 详 细 信 息 , 请 参 见 《<strong>Veritas</strong> <strong>Storage</strong> Foundation 管 理 指 南 》。系 统 启 动 时 , 卷 自 动 启 动 并 且 vxvol start 任 务 使 所 有 CLEAN Plex 变 为 ACTIVE状 态 。 关 机 时 ,vxvol stop 任 务 将 所 有 ACTIVE Plex 标 记 为 CLEAN。 如 果 启 动 时所 有 Plex 为 CLEAN 状 态 , 则 表 明 曾 发 生 了 受 控 关 机 , 系 统 将 优 化 启 动 卷 所 需 的 时间 。图 3-2 显 示 了 因 硬 件 问 题 、 非 正 常 关 机 和 系 统 管 理 员 干 预 而 可 能 导 致 的 Plex 状 态 之间 的 附 加 转 换 。


硬 件 故 障 后 恢 复Plex 状 态 循 环27图 3-2附 加 的 Plex 状 态 转 换创 建 PlexPS: 空PKS: 已 禁 用PS: 活 动PKS: 已 禁 用初 始 化 Plex(vxvol init clean)启 动(vxvol start)恢 复 数 据(vxvol resync)崩 溃 后 重 新 启 动(vxvol start)使 Plex 脱 机(vxmend off)PS: 干 净PKS: 已 禁 用PS: 活 动PKS: 已 启 用PS: 脱 机PKS: 已 禁 用关 闭 (vxvol stop)PS = plex state(Plex 状 态 )无 法 纠 正 的I/O 故 障PKS = plex kernel state(Plex 内 核 状 态 )PS:I/O 失 败PKS: 已 分 离重 新 同 步 数 据(vxplex att)重 新 同 步失 败使 Plex 联 机(vxmend on)PS: 失 效PKS: 已 分 离Plex 刚 创 建 时 的 状 态 为 EMPTY, 且 一 直 保 持 到 挂 接 该 Plex 的 卷 被 初 始 化 为 止 。 然后 其 状 态 被 设 置 为 CLEAN。 其 Plex 内 核 状 态 保 持 为 DISABLED, 直 到 卷 启 动 后 才设 置 为 ENABLED。在 系 统 崩 溃 并 重 新 启 动 后 , 卷 的 所 有 Plex 均 为 ACTIVE 状 态 , 但 Plex 内 核 状 态 仍为 DISABLED, 并 且 一 直 保 持 到 Plex 数 据 被 vxvol resync 任 务 恢 复 为 止 。可 以 使 用 vxmend off 命 令 使 Plex 脱 机 , 使 用 vxmend on 命 令 使 其 重 新 联 机 , 并 在使 用 vxplex att 重 新 挂 接 Plex 时 使 其 数 据 与 其 他 Plex 重 新 同 步 。 失 败 的 重 新 同步 或 无 法 纠 正 的 I/O 故 障 会 将 Plex 置 为 IOFAIL 状 态 。在 系 统 崩 溃 或 I/O 错 误 导 致 镜 像 卷 的 所 有 Plex 均 退 出 CLEAN 和 ACTIVE 状 态 时 可以 采 取 多 种 措 施 。请 参 见 第 28 页 的 “ 恢 复 不 可 启 动 的 镜 像 卷 ”。请 参 见 第 32 页 的 “RAID-5 卷 上 的 故 障 ”。


28硬 件 故 障 后 恢 复恢 复 不 可 启 动 的 镜 像 卷恢 复 不 可 启 动 的 镜 像 卷系 统 崩 溃 或 I/O 错 误 会 损 坏 镜 像 卷 的 一 个 或 多 个 Plex, 并 使 所 有 Plex 退 出 CLEAN或 ACTIVE 状 态 。 可 以 将 其 中 一 个 Plex 标 记 为 CLEAN, 并 指 示 系 统 使 用 该 Plex 作 为修 复 其 他 Plex 的 来 源 。恢 复 不 可 启 动 的 镜 像 卷1 使 用 以 下 命 令 将 所 需 的 Plex 置 为 CLEAN 状 态 :# vxmend [-g diskgroup] fix clean plex例 如 , 将 Plex vol01-02 置 为 CLEAN 状 态 :# vxmend -g mydg fix clean vol01-022 要 从 CLEAN Plex 恢 复 卷 中 的 其 他 Plex, 必 须 禁 用 该 卷 , 并 且 其 他 Plex 必 须 处于 STALE 状 态 。 可 根 据 需 要 对 所 有 其 他 CLEAN 或 ACTIVE Plex 依 次 运 行 以 下 命令 , 使 其 状 态 变 为 STALE:# vxmend [-g diskgroup] fix stale plex承 载 卷 的 所 有 镜 像 Plex 的 几 个 磁 盘 或 其 他 相 关 子 系 统 发 生 严 重 的 硬 件 故 障 后 ,用 户 可 能 无 法 使 用 vxmend 恢 复 卷 。 在 这 种 情 况 下 , 可 以 先 删 除 该 卷 , 在 正 常工 作 的 硬 件 上 重 新 创 建 它 , 然 后 从 备 份 或 快 照 映 像 中 还 原 该 卷 的 内 容 。请 参 见 vxmend(1M) 手 册 页 。3 要 启 用 CLEAN Plex 并 从 中 恢 复 STALE Plex, 请 使 用 以 下 命 令 :# vxvol [-g diskgroup] start volume例 如 , 要 恢 复 卷 vol01, 请 使 用 以 下 命 令 :# vxvol -g mydg start vol01请 参 见 vxvol(1M) 手 册 页 。恢 复 不 可 启 动 的 卷 ( 其 中 禁 用 的 Plex 为 RECOVER 状态 )如 果 某 个 Plex 的 内 容 相 对 于 卷 来 说 已 过 时 , 则 该 Plex 会 显 示 为 RECOVER 状 态 。当 包 含 Plex 的 一 个 或 多 个 子 磁 盘 的 磁 盘 被 替 换 或 重 新 挂 接 时 , 会 发 生 这 种 情 况 。如 果 某 个 Plex 显 示 为 这 种 状 态 , 可 通 过 vxmend 和 vxvol 命 令 恢 复 :


硬 件 故 障 后 恢 复强 制 重 新 启 动 禁 用 的 卷29恢 复 不 可 启 动 的 卷 ( 其 中 禁 用 的 Plex 为 RECOVER 状 态 )1 使 用 以 下 命 令 将 Plex 强 制 设 为 OFFLINE 状 态 :# vxmend [-g diskgroup] -o force off plex2 使 用 以 下 命 令 将 Plex 置 于 STALE 状 态 :# vxmend [-g diskgroup] on plex3 如 果 卷 中 有 其 他 ACTIVE 或 CLEAN 状 态 的 Plex, 请 使 用 以 下 命 令 将 Plex 重 新挂 接 到 卷 中 :# vxplex [-g diskgroup] att volume plex如 果 卷 已 经 启 用 ,Plex 的 重 新 同 步 将 立 即 开 始 。如 果 卷 中 没 有 其 他 CLEAN 状 态 的 Plex, 请 使 用 以 下 命 令 将 Plex 设 为 DISABLED和 CLEAN 状 态 :# vxmend [-g diskgroup] fix clean plex4 如 果 尚 未 启 用 卷 , 请 使 用 以 下 命 令 启 动 卷 , 并 在 后 台 执 行 所 有 的 Plex 重 新 同步 :强 制 重 新 启 动 禁 用 的 卷# vxvol [-g diskgroup] -o bg start volume当 Plex 中 的 数 据 已 损 坏 , 并 且 卷 中 没 有 可 以 从 中 重 新 同 步 卷 内 容 的 ACTIVE 或CLEAN 冗 余 Plex 时 , 必 须 从 备 份 或 快 照 映 像 中 还 原 卷 。如 果 由 于 磁 盘 故 障 导 致 某 个 卷 被 禁 用 , 并 且 该 卷 中 未 包 含 任 何 有 效 的 冗 余 Plex, 则必 须 在 更 换 出 错 的 磁 盘 后 从 备 份 还 原 该 卷 。 对 于 所 有 被 列 为 Unstartable 的 卷 , 必须 先 使 用 vxvol 命 令 重 新 启 动 这 些 卷 , 然 后 才 能 从 备 份 中 还 原 其 内 容 。强 制 重 新 启 动 禁 用 的 卷◆ 键 入 以 下 命 令 :# vxvol [-g diskgroup] -o bg -f start volume-f 选 项 将 强 制 重 新 启 动 卷 , 而 -o bg 选 项 则 作 为 后 台 任 务 重 新 同 步 其 Plex。例 如 , 要 重 新 启 动 卷 myvol, 以 便 能 够 从 备 份 中 还 原 它 , 可 使 用 以 下 命 令 :# vxvol -g mydg -o bg -f start myvol


30硬 件 故 障 后 恢 复清 除 磁 盘 上 的 failing 标 志清 除 磁 盘 上 的 failing 标 志如 果 I/O 错 误 是 间 歇 性 的 而 非 持 久 性 的 , 则 <strong>Veritas</strong> Volume Manager 会 在 磁 盘 上设 置 failing 标 志 , 而 不 是 分 离 磁 盘 。 临 时 拔 掉 电 缆 、 控 制 器 出 错 、 磁 盘 阵 列 中 有部 分 出 错 的 LUN 或 者 磁 盘 中 有 少 量 损 坏 的 扇 区 或 磁 道 , 都 会 引 发 此 类 错 误 。如 果 硬 件 错 误 不 是 由 磁 盘 本 身 造 成 的 ( 例 如 , 是 由 控 制 器 出 问 题 或 磁 盘 电 缆 出 问 题造 成 的 ), 则 可 以 在 从 根 本 上 纠 正 I/O 错 误 之 后 , 使 用 vxedit 命 令 清 除 failing标 志 。警 告 : 如 果 不 知 道 引 发 I/O 错 误 的 原 因 , 请 不 要 清 除 failing 标 志 。 如 果 磁 盘 硬 件确 实 出 现 了 问 题 , 而 您 又 清 除 了 failing 标 志 , 则 会 有 丢 失 数 据 的 危 险 。清 除 磁 盘 上 的 failing 标 志1 使 用 vxdisk list 命 令 找 出 出 错 的 磁 盘 :# vxdisk listDEVICE TYPE DISK GROUP STATUSc1t1d0 auto:simple mydg01 mydg onlinec1t1d0 auto:simple mydg02 mydg online failingc1t1d0 auto:simple mydg03 mydg online. . .2 使 用 vxedit set 命 令 为 每 个 被 标 记 为 failing 的 磁 盘 ( 在 本 例 中 为 mydg02)清 除 标 志 :# vxedit -g mydg set failing=off mydg023 使 用 vxdisk list 命 令 确 认 已 清 除 failing 标 志 :# vxdisk listDEVICE TYPE DISK GROUP STATUSc1t1d0 auto:simple mydg01 mydg onlinec1t2d0 auto:simple mydg02 mydg onlinec1t3d0 auto:simple mydg03 mydg online. . .


硬 件 故 障 后 恢 复重 新 挂 接 出 错 的 磁 盘31重 新 挂 接 出 错 的 磁 盘如 果 系 统 在 启 动 时 找 不 到 某 个 磁 盘 , 或 者 在 VxVM 启 动 时 某 些 磁 盘 驱 动 程 序 被 卸 载或 无 法 装 载 ( 从 而 导 致 磁 盘 进 入 failed 状 态 ), 则 可 以 执 行 重 新 挂 接 操 作 。 解 决根 本 问 题 ( 如 电 缆 或 控 制 器 错 误 ) 之 后 , 使 用 vxreattach 命 令 重 新 挂 接 磁 盘 , 重新 挂 接 之 后 Plex 不 会 被 标 记 为 STALE。 但 是 , 重 新 挂 接 操 作 必 须 在 启 动 磁 盘 上 的卷 之 前 进 行 。作 为 磁 盘 恢 复 过 程 的 一 部 分 , 可 以 在 引 导 期 间 从 vxdiskadm 菜 单 中 调 用 vxreattach命 令 。 如 果 可 能 ,vxreattach 将 出 错 的 磁 盘 介 质 记 录 重 新 挂 接 到 具 有 同 一 设 备 名称 的 磁 盘 上 。 重 新 挂 接 操 作 会 将 磁 盘 放 在 它 以 前 所 属 的 同 一 磁 盘 组 中 , 并 保 留 其 原有 磁 盘 介 质 名 。重 新 挂 接 出 错 的 磁 盘1 如 下 例 所 示 , 使 用 vxdisk list 命 令 查 看 出 错 的 磁 盘 :# vxdisk listDEVICE TYPE DISK GROUP STATUSc1t1d0 auto:simple mydg01 mydg onlinec1t2d0 auto:simple mydg02 mydg online- - mydg03 mydg failed was: c1t3d0- - mydg04 mydg failed was: c1t4d02 一 旦 纠 正 错 误 , 便 可 使 用 如 下 命 令 重 新 扫 描 设 备 列 表 , 进 而 重 新 挂 接 磁 盘 :# /usr/sbin/vxdctl enable3 使 用 不 带 任 何 选 项 的 vxreattach 命 令 重 新 挂 接 磁 盘 :# /etc/vx/bin/vxreattach执 行 重 新 挂 接 操 作 之 后 , 除 非 磁 盘 出 错 且 必 须 替 换 , 否 则 不 必 进 行 恢 复 。 如 果最 初 的 磁 盘 故 障 起 因 ( 或 其 他 原 因 ) 仍 然 存 在 , 则 重 新 挂 接 操 作 可 能 失 败 。可 以 不 执 行 重 新 挂 接 操 作 , 而 是 先 使 用 vxreattach -c 命 令 来 检 查 该 操 作 是 否可 行 。 该 命 令 显 示 可 以 重 新 挂 接 磁 盘 的 磁 盘 组 和 磁 盘 介 质 名 称 。请 参 见 vxreattach(1M) 手 册 页 。在 Plex 挂 接 或 同 步 操 作 失 败 后 恢 复Plex 挂 接 操 作 要 求 Plex 与 卷 中 的 现 有 Plex 保 持 同 步 。 其 他 操 作 ( 例 如 为 卷 创 建 镜像 ) 也 要 求 Plex 同 步 。 Plex 同 步 可 能 是 长 时 间 运 行 的 操 作 , 具 体 取 决 于 卷 的 大 小以 及 需 要 同 步 的 数 据 量 。


32硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障RAID-5 卷 上 的 故 障此 版 本 中 的 恢 复 行 为 已 在 以 前 版 本 的 VxVM 基 础 上 进 行 了 更 改 。 过 去 , 如 果 Plex同 步 中 断 , 则 在 卷 恢 复 期 间 VxVM 会 从 卷 中 分 离 Plex。 这 时 需 要 手 动 重 新 开 始 Plex同 步 。 如 果 磁 盘 组 版 本 低 于 170, 则 会 保 留 此 行 为 。如 果 磁 盘 组 版 本 为 170 或 180 并 由 vxplex att、vxassist mirror、vxsnap addmir或 vxsnap reattach 命 令 触 发 Plex 重 新 同 步 , 则 在 卷 恢 复 期 间 ,Plex 会 保 持 与 卷关 联 。VxVM 会 检 测 到 同 步 已 中 断 , 然 后 恢 复 同 步 。 如 果 卷 具 有 关 联 的 DCO(20版 本 或 更 高 版 本 ), 则 VxVM 会 跟 踪 Plex 同 步 期 间 所 发 生 的 更 改 ; 当 同 步 因 系 统崩 溃 或 vxconfigd 故 障 而 失 败 时 ,VxVM 会 从 失 败 所 在 点 恢 复 同 步 。 同 步 在 后 台执 行 , 因 此 使 用 卷 时 没 有 延 迟 。 如 果 卷 没 有 关 联 的 DCO, 但 有 170 或 更 高 版 本 的磁 盘 组 , 则 同 步 会 从 头 重 新 开 始 。在 创 建 卷 并 通 过 一 个 操 作 (vxassist make nmirror=2) 添 加 镜 像 时 , 不 会 为 自 动 恢复 跟 踪 该 镜 像 的 同 步 。 要 确 保 同 步 从 它 失 败 所 在 点 恢 复 , 请 首 先 创 建 卷 , 然 后 使 用vxassist mirror 命 令 添 加 镜 像 。在 某 些 情 况 下 ,VxVM 可 自 动 恢 复 卷 。 如 果 您 需 要 手 动 恢 复 卷 , 则 vxrecover 命令 会 为 同 步 过 程 失 败 的 所 有 Plex 触 发 同 步 。 这 些 Plex 的 状 态 为 TEMP、TEMPRM或 TEMPRMSD。在 CVM 环 境 中 , 如 果 在 执 行 Plex 同 步 期 间 主 节 点 崩 溃 , 则 在 恢 复 主 节 点 后 新 的 主节 点 会 从 主 节 点 失 败 所 在 点 重 新 开 始 同 步 。 磁 盘 组 版 本 必 须 为 170 版 或 更 高 版 本 。如 果 磁 盘 组 为 170 版 本 , 但 未 挂 接 DCO, 则 同 步 会 从 头 重 新 开 始 。可 以 使 用 Ctrl-C 或 vxtask abort 命 令 中 止 Plex 挂 接 操 作 或 同 步 操 作 。 在 这 种 情况 下 ,VxVM 会 将 Plex 从 卷 中 分 离 。故 障 有 两 种 : 系 统 故 障 与 磁 盘 故 障 。 系 统 故 障 是 指 因 操 作 系 统 混 乱 或 电 源 故 障 而 使系 统 突 然 停 止 运 行 。 磁 盘 故 障 是 指 因 系 统 故 障 ( 如 磁 头 划 盘 、 磁 盘 上 的 电 子 元 件 故障 或 磁 盘 控 制 器 故 障 ) 而 使 一 些 磁 盘 上 的 数 据 不 可 用 。系 统 故 障RAID-5 卷 的 设 计 使 其 能 够 在 磁 盘 发 生 故 障 时 以 最 低 的 磁 盘 空 间 消 耗 来 保 持 可 用 性 。但 是 , 在 发 生 系 统 故 障 后 , 许 多 RAID-5 形 式 的 卷 都 会 有 数 据 丢 失 。 导 致 数 据 丢 失的 原 因 是 系 统 故 障 致 使 RAID-5 卷 中 的 数 据 和 奇 偶 校 验 不 再 同 步 。 而 失 去 同 步 则 是因 故 障 发 生 时 无 法 确 定 未 完 成 的 写 操 作 的 状 态 所 致 。如 果 在 访 问 RAID-5 卷 时 失 去 同 步 , 则 将 该 卷 描 述 为 具 有 失 效 的 奇 偶 校 验 。 此 时 必须 通 过 以 下 方 法 重 新 构 建 奇 偶 校 验 : 读 取 每 个 条 带 中 的 所 有 非 奇 偶 列 , 重 新 计 算 奇偶 校 验 , 然 后 写 出 条 带 中 的 奇 偶 校 验 条 带 单 元 。 由 于 必 须 对 卷 中 的 每 个 条 带 执 行 此操 作 , 因 此 这 需 要 很 长 时 间 才 能 完 成 。


硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障33警 告 : 当 对 没 有 日 志 Plex 的 RAID-5 卷 进 行 重 新 同 步 时 , 卷 中 磁 盘 的 任 何 故 障 都 会导 致 其 数 据 丢 失 。重 同 步 过 程 除 易 出 故 障 之 外 , 还 会 占 用 系 统 资 源 并 使 系 统 运 行 速 度 变 慢 。RAID-5 日 志 保 留 故 障 发 生 时 所 写 入 数 据 的 副 本 , 因 而 可 减 少 因 系 统 故 障 导 致 的 损失 。 重 同 步 过 程 包 括 从 日 志 中 读 取 数 据 及 奇 偶 校 验 , 然 后 将 它 们 写 入 RAID-5 卷 的相 应 区 域 。 这 可 以 大 大 缩 短 数 据 和 奇 偶 校 验 重 同 步 所 需 的 时 间 。 它 还 意 味 着 卷 永 远不 会 真 正 失 效 。 任 何 时 候 卷 中 所 有 条 带 的 数 据 和 奇 偶 校 验 均 为 已 知 , 因 此 , 单 个 磁盘 的 故 障 不 会 导 致 卷 中 的 数 据 丢 失 。磁 盘 故 障当 磁 盘 故 障 、 电 缆 连 接 或 其 他 问 题 导 致 磁 盘 上 的 数 据 不 可 用 时 , 将 出 现 无 法 纠 正 的I/O 错 误 。 对 于 RAID-5 卷 , 则 意 味 着 有 一 个 子 磁 盘 不 可 用 。 该 子 磁 盘 不 能 用 来 存储 数 据 , 并 且 被 视 为 失 效 且 已 分 离 。 即 使 基 础 磁 盘 变 为 可 用 或 被 更 换 , 该 子 磁 盘 仍被 视 为 失 效 并 且 不 被 使 用 。当 系 统 尝 试 读 取 失 效 子 磁 盘 上 的 数 据 时 , 它 将 通 过 条 带 中 所 有 其 他 条 带 单 元 上 的 数据 重 新 构 建 这 些 数 据 。 此 操 作 称 为 重 构 读 取 。 与 单 纯 读 取 数 据 相 比 , 这 是 一 个 开 销很 大 的 操 作 , 会 导 致 读 取 性 能 下 降 。 当 RAID-5 卷 包 含 失 效 的 子 磁 盘 时 , 它 被 视 为处 于 退 化 模 式 。处 于 退 化 模 式 的 RAID-5 卷 可 从 vxprint -ht 命 令 的 输 出 中 识 别 出 来 , 如 下 所 示 :V NAME RVG/VSET/COKSTATE STATE LENGTH READPOL PREFPLEX UTYPEPL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODESD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODESV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODE...v r5vol - ENABLED DEGRADED 204800 RAID - raid5pl r5vol-01 r5vol ENABLED ACTIVE 204800 RAID 3/16 RWsd disk01-01 r5vol-01disk01 0 102400 0/0 c2t9d0 ENAsd disk02-01 r5vol-01disk02 0 102400 1/0 c2t10d0 dSsd disk03-01 r5vol-01disk03 0 102400 2/0 c2t11d0 ENApl r5vol-02 r5vol ENABLED LOG 1440 CONCAT - RWsd disk04-01 r5vol-02disk04 0 1440 0 c2t12d0 ENApl r5vol-03 r5vol ENABLED LOG 1440 CONCAT - RWsd disk05-01 r5vol-03disk05 0 1440 0 c2t14d0 ENA如 卷 状 态 所 示 , 卷 r5vol 处 于 退 化 模 式 , 它 被 标 为 DEGRADED。 出 错 的 子 磁 盘 是disk02-01, 如 MODE 标 志 所 示 ;d 表 示 子 磁 盘 已 分 离 ,S 表 示 子 磁 盘 的 内 容 失 效 。警 告 : 不 要 对 处 于 退 化 模 式 的 RAID-5 卷 运 行 vxr5check 命 令 。


34硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障包 含 RAID-5 日 志 Plex 的 磁 盘 也 可 能 会 发 生 故 障 。 如 果 RAID-5 日 志 已 镜 像 , 则 单个 RAID-5 日 志 Plex 出 故 障 对 卷 的 操 作 没 有 直 接 影 响 。 但 是 , 卷 中 所 有 RAID-5 日志 Plex 丢 失 会 使 卷 容 易 彻 底 失 败 。 在 vxprint -ht 命 令 的 输 出 中 , 有 故 障 的 RAID-5日 志 Plex 是 通 过 显 示 为 BADLOG( 而 不 是 LOG) 的 Plex 状 态 来 指 示 。在 以 下 示 例 中 ,RAID-5 日 志 Plex r5vol-02 失 败 :V NAME RVG/VSET/COKSTATE STATE LENGTH READPOL PREFPLEX UTYPEPL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODESD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODESV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODE...v r5vol - ENABLED ACTIVE 204800 RAID - raid5pl r5vol-01 r5vol ENABLED ACTIVE 204800 RAID 3/16 RWsd disk01-01 r5vol-01disk01 0 102400 0/0 c2t9d0 ENAsd disk02-01 r5vol-01disk02 0 102400 1/0 c2t10d0 ENAsd disk03-01 r5vol-01disk03 0 102400 2/0 c2t11d0 ENApl r5vol-02 r5vol DISABLED BADLOG 1440 CONCAT - RWsd disk04-01 r5vol-02disk04 0 1440 0 c2t12d0 ENApl r5vol-03 r5vol ENABLED LOG 1440 CONCAT - RWsd disk05-01 r5vol-12disk05 0 1440 0 c2t14d0 ENARAID-5 的 默 认 启 动 恢 复 过 程VxVM 可 能 需 要 执 行 若 干 操 作 才 能 完 全 还 原 RAID-5 卷 的 内 容 并 使 它 可 用 。 无 论 何时 启 动 卷 , 所 有 RAID-5 日 志 Plex 均 在 卷 启 动 之 前 被 设 置 为 零 。 这 样 可 以 防 止 随 机数 据 被 解 释 为 日 志 项 并 破 坏 卷 的 内 容 。 此 外 , 还 可 能 需 要 恢 复 某 些 子 磁 盘 , 或 可 能需 要 重 同 步 奇 偶 校 验 ( 如 果 RAID-5 日 志 出 错 )。启 动 RAID-5 卷 时 ,VxVM 执 行 下 列 步 骤 :■■■如 果 RAID-5 卷 未 正 常 关 闭 , 则 检 查 它 是 否 存 在 有 效 的 RAID-5 日 志 Plex。如 果 存 在 有 效 的 日 志 Plex, 则 重 放 它 们 。 重 放 过 程 是 通 过 将 卷 内 核 状 态 置 为DETACHED、 将 卷 状 态 设 置 为 REPLAY 并 启 用 RAID-5 日 志 Plex 来 完 成 的 。如 果 没 有 有 效 的 日 志 , 则 必 须 重 同 步 奇 偶 校 验 。 重 新 同 步 是 通 过 将 卷 内 核 状 态置 为 DETACHED 并 将 卷 状 态 设 置 为 SYNC 来 完 成 的 。 所 有 的 日 志 Plex 都 保 持DISABLED Plex 内 核 状 态 。由 于 重 同 步 奇 偶 校 验 过 程 中 任 何 子 磁 盘 失 败 都 会 导 致 卷 无 法 使 用 , 因 此 重 同 步期 间 卷 被 设 为 不 可 用 。 通 过 将 -o unsafe start 选 项 和 vxvol 命 令 一 起 使 用 可 改写 此 设 置 。 如 果 存 在 任 何 失 效 的 子 磁 盘 , 则 RAID-5 卷 无 法 使 用 。警 告 :-o unsafe start 选 项 被 视 为 是 有 害 选 项 , 因 为 它 会 使 卷 的 内 容 不 可 用 。因 此 建 议 不 要 使 用 该 选 项 。


硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障35■ 将 现 有 的 所 有 日 志 Plex 置 零 并 启 用 这 些 日 志 。 如 果 此 过 程 中 所 有 日 志 都 失 败 ,则 启 动 进 程 中 止 。■如 果 不 存 在 失 效 子 磁 盘 或 现 有 的 失 效 子 磁 盘 可 以 恢 复 , 则 卷 被 置 为 ENABLED 卷内 核 状 态 , 卷 状 态 被 设 置 为 ACTIVE。 至 此 , 卷 已 启 动 。恢 复 RAID-5 卷对 于 RAID-5 卷 , 可 能 需 要 执 行 以 下 类 型 的 恢 复 :■■■重 新 同 步 奇 偶 校 验重 新 挂 接 出 错 的 RAID-5 日 志 Plex恢 复 失 效 子 磁 盘通 常 在 RAID-5 卷 启 动 时 或 系 统 引 导 之 后 不 久 执 行 奇 偶 校 验 重 同 步 和 失 效 子 磁 盘 恢复 。 也 可 通 过 运 行 vxrecover 命 令 来 执 行 它 们 。请 参 见 第 38 页 的 “ 不 可 启 动 的 RAID-5 卷 ”。如 果 磁 盘 发 生 故 障 时 热 重 定 位 功 能 是 激 活 的 , 除 非 没 有 合 适 的 磁 盘 空 间 用 于 重 定位 , 否 则 不 需 要 系 统 管 理 员 干 预 。 热 重 定 位 功 能 通 过 故 障 触 发 , 并 且 系 统 管 理 员 会收 到 有 关 故 障 的 电 子 邮 件 通 知 。热 重 定 位 操 作 自 动 尝 试 重 定 位 出 错 的 RAID-5 Plex 的 子 磁 盘 。 发 生 重 定 位 后 , 热 重定 位 后 台 驻 留 程 序 (vxrelocd) 还 会 启 动 奇 偶 校 验 重 同 步 。如 果 RAID-5 日 志 Plex 失 败 , 则 仅 当 该 日 志 Plex 已 被 镜 像 时 才 发 生 重 定 位 ;vxrelocd 后 台 驻 留 程 序 此 时 启 动 镜 像 重 同 步 来 重 新 创 建 RAID-5 日 志 Plex。 如 果 在故 障 发 生 时 热 重 定 位 功 能 被 禁 用 , 则 需 要 系 统 管 理 员 来 启 动 重 同 步 或 恢 复 操 作 。注 意 : 承 载 RAID-5 Plex 的 几 个 磁 盘 或 其 他 相 关 子 系 统 发 生 严 重 的 硬 件 故 障 后 , 可能 只 能 通 过 删 除 该 卷 、 在 正 常 工 作 的 硬 件 上 重 新 创 建 , 然 后 从 备 份 中 还 原 该 卷 的 内容 才 能 还 原 该 卷 。重 新 同 步 RAID-5 卷 中 的 奇 偶 校 验大 多 数 情 况 下 ,RAID-5 卷 没 有 失 效 的 奇 偶 校 验 。 仅 当 RAID-5 卷 的 所 有 RAID-5 日志 Plex 都 失 败 并 且 存 在 系 统 故 障 时 , 才 出 现 失 效 的 奇 偶 校 验 。 即 使 RAID-5 卷 有 失效 的 奇 偶 校 验 , 通 常 也 会 在 卷 启 动 过 程 中 修 复 它 。如 果 启 动 了 没 有 有 效 的 RAID-5 日 志 的 卷 并 且 该 进 程 在 卷 重 新 同 步 之 前 停 止 , 则 会产 生 带 失 效 的 奇 偶 校 验 的 活 动 卷 。以 下 是 vxprint -ht 命 令 对 于 失 效 的 RAID-5 卷 的 示 例 输 出 :V NAME RVG/VSET/COKSTATE STATE LENGTH READPOL PREFPLEX UTYPEPL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODE


36硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障SD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODESV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODE...v r5vol - ENABLED NEEDSYNC 204800 RAID - raid5pl r5vol-01 r5vol ENABLED ACTIVE 204800 RAID 3/16 RWsd disk01-01 r5vol-01 disk01 0 102400 0/0 c2t9d0 ENAsd disk02-01 r5vol-01 disk02 0 102400 1/0 c2t10d0 dSsd disk03-01 r5vol-01 disk03 0 102400 2/0 c2t11d0 ENA...此 输 出 将 卷 状 态 显 示 为 NEEDSYNC, 表 明 需 要 重 新 同 步 奇 偶 校 验 。 卷 状 态 也 可 能 是SYNC, 表 明 启 动 时 尝 试 进 行 同 步 , 并 且 同 步 进 程 应 正 在 执 行 同 步 。 如 果 不 存 在 这 样的 进 程 , 或 者 卷 处 于 NEEDSYNC 状 态 , 则 可 以 通 过 对 vxvol 命 令 使 用 resync 关 键字 来 手 动 启 动 同 步 操 作 。通 过 向 RAID-5 卷 发 出 VOL_R5_RESYNC ioctls 可 重 新 生 成 奇 偶 校 验 。 重 新 同 步 过程 从 RAID-5 卷 的 起 始 处 开 始 , 对 大 小 等 于 -o iosize 选 项 指 定 的 扇 区 数 的 区 域 进行 重 新 同 步 。 如 果 未 指 定 -o iosize 选 项 , 则 使 用 默 认 的 最 大 I/O 大 小 。 然 后 ,resync 操 作 移 到 下 一 个 区 域 进 行 , 直 到 整 个 RAID-5 卷 长 都 被 重 新 同 步 为 止 。对 于 较 大 的 卷 , 奇 偶 校 验 重 建 需 要 很 长 时 间 , 在 操 作 完 成 前 有 可 能 发 生 系 统 关 机 或崩 溃 。 如 果 系 统 关 机 , 奇 偶 校 验 重 建 过 程 必 须 在 系 统 重 新 启 动 后 继 续 进 行 。 否 则 ,该 过 程 必 须 从 头 开 始 。为 了 避 免 从 头 再 来 , 奇 偶 校 验 重 建 中 将 被 设 置 检 查 点 。 这 意 味 着 奇 偶 校 验 重 建 过 程所 到 达 的 偏 移 位 置 将 被 存 储 在 配 置 数 据 库 中 。-o checkpt=size 选 项 控 制 保 存 检 查点 的 频 率 。 如 果 未 指 定 该 选 项 , 则 使 用 默 认 的 检 查 点 大 小 。由 于 保 存 检 查 点 偏 移 要 求 进 行 事 务 处 理 , 因 此 检 查 点 太 小 会 延 长 奇 偶 校 验 重 建 所 需的 时 间 。 在 重 新 启 动 系 统 后 , 检 查 点 偏 移 小 于 卷 长 的 RAID-5 卷 会 在 检 查 点 偏 移 处启 动 奇 偶 校 验 重 新 同 步 。重 新 同 步 RAID-5 卷 中 的 奇 偶 校 验◆ 键 入 以 下 命 令 :# vxvol -g diskgroup resync r5vol重 新 挂 接 出 错 的 RAID-5 日 志 Plex磁 盘 故 障 可 能 会 使 RAID-5 日 志 Plex 分 离 。 在 vxplex 命 令 中 使 用 att 关 键 字 可 以重 新 挂 接 这 些 RAID-5 日 志 。


硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障37重 新 挂 接 出 错 的 RAID-5 日 志 Plex◆ 键 入 以 下 命 令 :# vxplex -g diskgroup att r5vol r5vol-plex恢 复 RAID-5 卷 中 的 失 效 子 磁 盘失 效 子 磁 盘 的 恢 复 通 常 在 卷 启 动 时 完 成 。 但 是 , 执 行 恢 复 的 进 程 可 能 会 崩 溃 , 或 者卷 可 能 是 通 过 -o delayrecover 这 样 的 妨 碍 子 磁 盘 恢 复 的 选 项 启 动 的 。 此 外 , 还 有可 能 未 执 行 恢 复 操 作 就 替 换 了 子 磁 盘 所 在 的 磁 盘 。 在 这 些 情 况 下 , 可 以 使 用 vxvolrecover 命 令 执 行 子 磁 盘 恢 复 。恢 复 RAID-5 卷 中 的 失 效 子 磁 盘◆ 键 入 以 下 命 令 :# vxvol -g diskgroup recover r5vol subdisk具 有 多 个 失 效 子 磁 盘 的 RAID-5 卷 只 需 一 个 操 作 即 可 恢 复 。 要 恢 复 多 个 失 效 子磁 盘 , 请 对 卷 使 用 vxvol recover 命 令 :# vxvol -g diskgroup recover r5vol在 移 动 RAID-5 子 磁 盘 后 恢 复当 移 动 或 更 换 了 RAID-5 子 磁 盘 时 , 新 的 子 磁 盘 被 标 记 为 STALE 以 待 恢 复 。 如 果 卷是 活 动 的 , 则 可 以 使 用 vxsd 命 令 对 卷 进 行 恢 复 。 如 果 卷 处 于 非 活 动 状 态 , 则 当 它下 次 启 动 时 会 进 行 恢 复 。 恢 复 操 作 期 间 的 RAID-5 卷 是 退 化 的 。移 动 操 作 所 涉 及 的 条 带 中 的 任 何 故 障 都 会 使 卷 不 可 用 。 如 果 奇 偶 校 验 失 效 , 则 RAID-5卷 也 会 变 为 无 效 。为 避 免 卷 不 可 用 , 在 下 列 情 况 下 ,vxsd 命 令 不 允 许 移 动 子 磁 盘 :■ 失 效 子 磁 盘 占 用 了 正 在 移 动 的 子 磁 盘 所 用 的 任 何 条 带 。■ RAID-5 卷 停 止 但 未 正 常 关 闭 ; 即 , 奇 偶 校 验 被 视 为 失 效 。■ RAID-5 卷 活 动 并 且 没 有 有 效 的 日 志 区 域 。只 有 第 三 种 情 况 可 通 过 使 用 -o force 选 项 来 改 写 。RAID-5 卷 的 子 磁 盘 还 可 以 使 用 vxsd split 命 令 和 vxsd join 命 令 拆 分 或 结 合 。这 些 操 作 的 工 作 方 式 与 在 镜 像 卷 上 相 同 。RAID-5 子 磁 盘 移 动 和 其 他 卷 类 型 的 子 磁 盘 移 动 的 执 行 方 式 相 同 , 但 没 有 冗 余 退 化的 缺 点 。


Rogério Sanches Cunhaquestão, da pena abstratamente prevista para o tráfico de drogas – “reclusãode 5 (cinco) a 15 (quinze) anos e pagamento de 500 (quinhentos) a 1.500(mil e quinhentos) dias-multa” (art. 33 da Lei de drogas) –, a Sexta Turmado STJ (REsp 915.442-SC, DJe 1º/2/2011) dispôs que “A Lei 9.677/98,ao alterar a pena prevista para os delitos descritos no artigo 273 do CódigoPenal, mostrou-se excessivamente desproporcional, cabendo, portanto, aoJudiciário promover o ajuste principiológico da norma [...] Trat<strong>and</strong>o-se decrime hediondo, de perigo abstrato, que tem como bem jurídico tuteladoa saúde pública, mostra-se razoável a aplicação do preceito secundário dodelito de tráfico de drogas ao crime de falsificação, corrupção, adulteraçãoou alteração de produto destinado a fins terapêuticos ou medicinais” (AI noHC 239.363/PR, Rel. Min. Sebastião Reis Júnior, julgado em 26/2/2015,DJe 10/4/2015 – Info 559).25. MOEDA FALSA:O STJ considerou inaplicável o arrependimento posterior no crime demoeda falsa, que, trat<strong>and</strong>o-se de delito contra a fé pública, torna irrelevanteeventual prejuízo àquele que recebeu as cédulas falsificadas. Neste crime,“a vítima é a coletividade como um todo, e o bem jurídico tutelado é a fépública, que não é passível de reparação. Desse modo, os crimes contra a fépública, semelhantes aos demais crimes não patrimoniais em geral, são incompatíveiscom o instituto do arrependimento posterior, dada a impossibilidadematerial de haver reparação do dano causado ou a restituição da coisasubtraída (REsp 1.242.294/PR, Rel. originário Min. Sebastião Reis Júnior,Rel. para acórdão Min. Rogerio Schietti Cruz, julgado em 18/11/2014, DJe3/2/2015 – Info 554).26. FALSIDADE DOCUMENTAL:É dominante o entendimento de que compete à justiça estadual processare julgar o crime de falsa anotação na Carteira de Trabalho e PrevidênciaSocial, atribuído à empresa privada (Súmula 62 do STJ). Esta súmula foieditada em 1992, antes, portanto, da alteração promovida no art. 297 doCódigo Penal pela Lei 9.983/00, introdutória dos parágrafos 3º e 4º, que tratam,na verdade, de falsos ideológicos relacionados a documentos previdenciários.Antes, portanto, não havia menção a documentos previdenciários.O tribunal, de qualquer maneira, fazia interpretação casuística a respeito dacompetência nesses crimes, a depender de quem poderia ser efetivamenteconsiderado lesado pela conduta: a) nos casos de simples omissão de anota-38


硬 件 故 障 后 恢 复RAID-5 卷 上 的 故 障39VxVM vxvol ERROR V-5-1-1237 Volume r5vol is not startable;some subdisks are unusable <strong>and</strong> the parity is stale.如 果 始 终 在 RAID-5 卷 中 使 用 两 个 或 更 多 的 RAID-5 日 志 Plex, 则 可 避 免 这 种 情 况 。RAID-5 日 志 Plex 可 防 止 卷 内 的 奇 偶 校 验 失 效 , 因 而 避 免 了 这 种 情 况 的 发 生 。请 参 见 第 32 页 的 “ 系 统 故 障 ”。强 制 启 动 具 有 失 效 子 磁 盘 的 RAID-5 卷即 使 子 磁 盘 被 标 记 为 失 效 也 可 以 启 动 卷 : 例 如 , 停 止 的 卷 有 失 效 的 奇 偶 校 验 , 没 有RAID-5 日 志 , 并 且 某 个 磁 盘 分 离 然 后 重 新 挂 接 , 就 属 于 这 种 情 况 。即 使 数 据 没 有 过 期 也 认 为 子 磁 盘 失 效 ( 原 因 是 在 子 磁 盘 不 可 用 时 使 用 了 卷 ), 并 认为 RAID-5 卷 无 效 。 为 防 止 这 种 情 况 的 发 生 , 应 尽 可 能 地 始 终 将 多 个 有 效 的 RAID-5日 志 与 卷 相 关 联 。强 制 启 动 具 有 失 效 子 磁 盘 的 RAID-5 卷◆ 指 定 vxvol start 命 令 的 -f 选 项 。# vxvol [-g diskgroup] -f start r5vol这 使 所 有 失 效 子 磁 盘 都 标 记 为 未 失 效 。 标 记 操 作 发 生 在 start 操 作 评 估 RAID-5卷 的 有 效 性 并 确 定 启 动 所 需 的 条 件 之 前 。 可 通 过 使 用 以 下 命 令 将 单 个 子 磁 盘 标记 为 未 失 效 :# vxmend [-g diskgroup] fix unstale subdisk如 果 某 些 子 磁 盘 因 失 效 而 需 要 恢 复 , 并 且 存 在 有 效 的 日 志 , 则 通 过 将 卷 置 为ENABLED 内 核 状 态 可 启 用 该 卷 , 并 且 在 子 磁 盘 修 复 期 间 该 卷 可 用 。 否 则 , 卷 的内 核 状 态 将 设 置 为 DETACHED, 并 且 该 卷 在 子 磁 盘 恢 复 期 间 不 可 用 。 这 样 做 是因 为 , 如 果 卷 活 动 时 系 统 崩 溃 或 卷 异 常 停 止 , 则 奇 偶 校 验 会 变 为 失 效 , 从 而 使卷 不 可 用 。 如 果 不 希 望 这 种 做 , 则 可 使 用 -o unsafe start 选 项 来 启 动 卷 。警 告 :-o unsafe start 选 项 被 视 为 是 有 害 选 项 , 因 为 它 会 使 卷 的 内 容 不 可用 。 因 此 建 议 不 要 使 用 此 选 项 。卷 状 态 设 置 为 RECOVER 并 还 原 失 效 子 磁 盘 。 由 于 每 个 子 磁 盘 上 的 数 据 变 为 有效 , 因 此 子 磁 盘 不 再 标 记 为 失 效 。 如 果 有 任 何 子 磁 盘 的 恢 复 失 败 且 没 有 有 效 的日 志 , 则 因 为 子 磁 盘 仍 处 于 失 效 状 态 , 卷 的 启 动 将 中 止 , 并 且 系 统 崩 溃 会 使RAID-5 卷 不 可 用 。 这 也 可 以 通 过 使 用 -o unsafe start 选 项 来 覆 盖 。如 果 卷 有 有 效 的 日 志 , 则 子 磁 盘 恢 复 故 障 会 被 记 录 下 来 , 但 不 会 停 止 启 动 过程 。当 所 有 子 磁 盘 均 恢 复 后 , 卷 变 为 ENABLED 内 核 状 态 且 标 记 为 ACTIVE。


40硬 件 故 障 后 恢 复在 不 完 整 的 磁 盘 组 移 动 后 恢 复在 不 完 整 的 磁 盘 组 移 动 后 恢 复如 果 在 磁 盘 组 移 动 、 拆 分 或 结 合 操 作 正 在 进 行 时 系 统 崩 溃 或 子 系 统 失 败 , 则 在 系 统重 新 启 动 或 子 系 统 修 复 时 ,VxVM 会 尝 试 反 转 或 完 成 此 操 作 。 具 体 是 反 转 还 是 完 成此 操 作 取 决 于 操 作 的 进 度 。能 否 自 动 恢 复 取 决 于 是 否 能 导 入 源 磁 盘 组 和 目 标 磁 盘 组 。 但 是 , 有 时 可 能 无 法 自 动恢 复 , 例 如 , 如 果 已 在 另 一 主 机 上 导 入 其 中 一 个 磁 盘 组 , 即 是 如 此 。在 不 完 整 的 磁 盘 组 移 动 后 恢 复1 使 用 vxprint 命 令 检 查 这 两 个 磁 盘 组 的 配 置 。 未 完 成 移 动 的 磁 盘 组 中 的 对 象 的TUTIL0 字 段 设 置 为 MOVE。2 输 入 以 下 命 令 尝 试 完 成 移 动 :# vxdg recover sourcedg如 果 因 为 其 中 一 个 磁 盘 组 已 导 入 到 另 一 主 机 或 因 为 它 不 存 在 而 不 能 导 入 , 则 此操 作 失 败 :VxVM vxdg ERROR V-5-1-2907 diskgroup: Disk group does not exist如 果 恢 复 失 败 , 请 根 据 需 要 执 行 下 列 步 骤 。3 如 果 磁 盘 组 已 导 入 到 另 一 主 机 , 将 它 从 那 个 主 机 上 逐 出 , 然 后 导 入 当 前 主 机 。如 果 在 源 磁 盘 组 或 目 标 磁 盘 组 中 , 所 有 需 要 的 对 象 均 已 存 在 , 则 使 用 以 下 命 令在 该 磁 盘 组 中 重 新 设 置 MOVE 标 志 :# vxdg -o clean recover diskgroup1在 另 一 磁 盘 组 上 使 用 以 下 命 令 , 将 那 些 TUTIL0 字 段 标 记 为 MOVE 的 对 象 删除 :# vxdg -o remove recover diskgroup24 如 果 只 能 导 入 一 个 磁 盘 组 , 则 使 用 以 下 命 令 在 此 磁 盘 组 上 重 新 设 置 MOVE 标志 :# vxdg -o clean recover diskgroup在 DCO 卷 出 现 故 障 后 恢 复从 数 据 更 改 对 象 (DCO) 卷 故 障 中 恢 复 的 步 骤 取 决 于 DCO 版 本 号 。有 关 DCO 版 本 的 信 息 , 请 参 见 《<strong>Veritas</strong> <strong>Storage</strong> Foundation 管 理 指 南 》。


硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复41持 久 性 快 速 重 新 同 步 使 用 DCO 卷 来 跟 踪 卷 中 的 已 更 改 区 域 。 如 果 读 取 或 写 入 DCO日 志 卷 时 发 生 错 误 , 则 分 离 该 卷 并 在 DCO 上 设 置 badlog 标 志 。 以 后 写 入 卷 的 所 有内 容 将 不 被 DCO 跟 踪 。以 下 vxprint 命 令 的 输 出 示 例 显 示 了 一 个 具 有 分 离 DCO 卷 的 完 整 卷 ( 为 清 楚 起 见 ,省 略 了 TUTIL0 和 PUTIL0 字 段 ):TY NAME ASSOC KSTATE LENGTH PLOFFS STATE ...dg mydg mydg - - - -dm mydg01 c4t50d0 - 35521408 - -dm mydg02 c4t51d0 - 35521408 - -dm mydg03 c4t52d0 - 35521408 - FAILINGdm mydg04 c4t53d0 - 35521408 - FAILINGdm mydg05 c4t54d0 - 35521408 - -v SNAP-vol1 fsgen ENABLED 204800 - ACTIVEpl vol1-03 SNAP-vol1 ENABLED 204800 - ACTIVEsd mydg05-01 vol1-03 ENABLED 204800 0 -dc SNAP-vol1_dco SNAP-vol1 - - - -v SNAP-vol1_dcl gen ENABLED 144 - ACTIVEpl vol1_dcl-03 SNAP-vol1_dcl ENABLED 144 - ACTIVEsd mydg05-02 vol1_dcl-03 ENABLED 144 0 -sp vol1_snp SNAP-vol1 - - - -v vol1 fsgen ENABLED 204800 - ACTIVEpl vol1-01 vol1 ENABLED 204800 - ACTIVEsd mydg01-01 vol1-01 ENABLED 204800 0 -pl vol1-02 vol1 ENABLED 204800 - ACTIVEsd mydg02-01 vol1-01 ENABLED 204800 0 -dc vol1_dco vol1 - - - BADLOGv vol1_dcl gen DETACHED 144 - DETACHpl vol1_dcl-01 vol1_dcl ENABLED 144 - ACTIVEsd mydg03-01 vol1_dcl-01 ENABLED 144 0 -pl vol1_dcl-02 vol1_dcl DETACHED 144 - IOFAILsd mydg04-01 vol1_dcl-02 ENABLED 144 0 RELOCATEsp SNAP-vol1_snp vol1 - - - -此 输 出 显 示 了 镜 像 卷 vol1、 它 的 快 照 卷 SNAP-vol1 以 及 它 们 相 应 的 DCO vol1_dco和 SNAP-vol1_dco。 保 存 vol1 的 DCO 卷 vol1_dcl 的 DCO Plex 的 两 个 磁 盘 mydg03和 mydg04 发 生 故 障 。 因 此 , 分 离 了 卷 vol1 的 DCO 卷 vol1_dcl, 并 将 vol1_dco的 状 态 设 置 为 BADLOG。 为 了 将 来 参 考 , 请 记 下 分 别 指 向 vol1 和 SNAP-vol1 的 snap对 象 vol1_snp 和 SNAP-vol1_snp 的 项 。


42硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复可 以 使 用 该 输 出 推 导 出 卷 的 DCO 名 称 ( 在 此 例 中 为 vol1_dco), 或 者 使 用 以 下vxprint 命 令 显 示 卷 的 DCO 名 称 :# vxprint [-g diskgroup] -F%dco_name volume可 以 使 用 vxprint 命 令 检 查 是 否 为 卷 的 DCO 设 置 了 badlog 标 志 , 如 下 所 示 :# vxprint [-g diskgroup] -F%badlog dco_name如 果 设 置 了 badlog 标 志 , 则 此 命 令 返 回 值 on。 对 于 上 面 的 输 出 示 例 , 此 命 令 应 采用 以 下 形 式 :# vxprint -g mydg -F%badlog vol1_dcoon可 以 使 用 以 下 命 令 验 证 DCO 的 版 本 号 :# vxprint [-g diskgroup] -F%version dco_name返 回 值 为 0 或 20。 对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxprint -g mydg -F%version vol1_dcoDCO 版 本 号 决 定 应 该 使 用 的 恢 复 过 程 。请 参 见 第 42 页 的 “ 恢 复 0 版 DCO 卷 ”。请 参 见 第 45 页 的 “ 恢 复 即 时 快 照 DCO 卷 ( 版 本 20 或 更 高 版 本 )”。恢 复 0 版 DCO 卷恢 复 0 版 DCO 卷1 解 决 导 致 I/O 故 障 的 问 题 。2 使 用 以 下 命 令 从 DCO 中 删 除 badlog 标 志 :# vxdco [-g diskgroup] -o force enable dco_name对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxdco -g mydg -o force enable vol1_dcovxprint 输 出 中 用 于 vol1_dco 的 项 现 在 类 似 于 :dc vol1_dco vol1 - - - -


硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复433 使 用 以 下 命 令 重 新 启 动 DCO 卷 :# vxvol [-g diskgroup] start dco_log_vol对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxvol -g mydg start vol1_dcl


44硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复4 使 用 vxassist snapclear 命 令 清 除 原 始 卷 及 其 所 有 快 照 的 快 速 重 新 同 步 映像 。 这 样 可 以 确 保 在 对 快 照 进 行 快 照 合 并 ( 执 行 完 全 重 新 同 步 ) 时 不 会 使 用 有可 能 失 效 的 快 速 重 新 同 步 映 像 。 任 何 后 续 的 卷 快 照 操 作 都 重 新 启 用 快 速 重 新 同步 跟 踪 。警 告 : 在 将 badlog 标 志 从 DCO 中 删 除 后 , 必 须 对 该 卷 的 所 有 快 照 使 用 vxassistsnapclear 命 令 。 否 则 , 在 对 快 照 进 行 快 照 合 并 时 有 可 能 丢 失 或 损 坏 数 据 。如 果 卷 及 其 快 照 卷 在 同 一 磁 盘 组 中 , 则 以 下 命 令 将 同 时 清 除 这 两 个 卷 的 快 速 重新 同 步 映 像 :# vxassist [-g diskgroup] snapclear volume \snap_obj_to_snapshot其 中 ,snap_obj_to_snapshot 是 与 指 向 快 照 卷 的 volume 关 联 的 snap 对 象 的 名称 。对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxassist -g mydg snapclear vol1 SNAP-vol1_snp如 果 快 照 卷 和 原 始 卷 在 不 同 的 磁 盘 组 中 , 则 必 须 分 别 对 每 个 卷 执 行 snapclear操 作 :# vxassist -g diskgroup1 snapclear volume snap_obj_to_snapshot# vxassist -g diskgroup2 snapclear snapvol snap_obj_to_volume其 中 ,snap_obj_to_volume 是 与 指 向 原 始 卷 的 快 照 卷 snapvol 关 联 的 snap 对象 的 名 称 。对 于 上 面 的 输 出 示 例 , 如 果 已 将 SNAP-vol1 移 到 磁 盘 组 snapdg 中 , 此 命 令 应采 用 以 下 形 式 :# vxassist -g mydg snapclear vol1 SNAP-vol1_snp# vxassist -g snapdg snapclear SNAP-vol1 vol1_snp


硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复455 要 对 执 行 了 snapclear 操 作 的 快 照 卷 进 行 快 照 合 并 , 请 使 用 以 下 命 令 ( 如 有 必要 , 可 在 使 用 vxdg move 命 令 将 快 照 Plex 移 回 原 始 磁 盘 组 之 后 执 行 ):# vxplex -f [-g diskgroup] snapback volume snapvol_plex对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxplex -f -g mydg snapback vol1 vol1-03不 能 使 用 vxassist snapback 命 令 , 因 为 snapclear 操 作 会 删 除 快 照 关 联 信息 。恢 复 即 时 快 照 DCO 卷 ( 版 本 20 或 更 高 版 本 )恢 复 即 时 快 照 DCO 卷1 解 决 导 致 I/O 故 障 的 问 题 。2 使 用 vxsnap 命 令 分 离 每 个 与 卷 关 联 的 完 整 空 间 即 时 快 照 卷 :# vxsnap [-g diskgroup] dis snapvol对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxsnap -g mydg dis SNAP-vol13 使 用 以 下 命 令 取 消 卷 的 准 备 :# vxsnap [-g diskgroup] unprepare volume对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxsnap -g mydg unprepare vol1


46硬 件 故 障 后 恢 复在 DCO 卷 出 现 故 障 后 恢 复4 使 用 vxvol 命 令 启 动 卷 :# vxvol [-g diskgroup] start volume对 于 上 面 的 输 出 示 例 , 此 命 令 应 采 用 以 下 形 式 :# vxvol -g mydg start vol15 使 用 以 下 命 令 再 次 准 备 卷 :# vxsnap [-g diskgroup] prepare volume [ndcomirs=number] \[regionsize=size] [drl=yes|no|sequential] \[storage_attribute ...]对 于 上 面 的 输 出 示 例 , 此 命 令 可 采 用 以 下 形 式 :# vxsnap -g mydg prepare vol1 ndcomirs=2 drl=yes这 将 为 DCO 卷 添 加 2 个 Plex, 还 将 启 用 DRL 和 快 速 重 新 同 步 ( 如 果 得 到 授权 )。有 关 如 何 使 用 vxsnap prepare 命 令 的 全 部 详 细 信 息 , 请 参 见 《<strong>Veritas</strong> <strong>Storage</strong>Foundation 管 理 指 南 》 和 vxsnap(1M) 手 册 页 。


4在 即 时 快 照 故 障 后 恢 复本 章 节 包 括 下 列 主 题 :■■■■■■■■■■在 vxsnap prepare 失 败 后 恢 复在 对 完 整 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 对 断 开 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 对 优 化 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 vxsnap restore 失 败 后 恢 复在 vxsnap refresh 失 败 后 恢 复在 “ 写 入 时 复 制 ” 失 败 后 恢 复发 生 重 新 同 步 I/O 错 误 后 恢 复DCO 卷 发 生 I/O 故 障 后 恢 复从 对 即 时 快 照 数 据 更 改 对 象 (DCO) 执 行 vxsnap upgrade 时 出 现 的 故 障 中 恢 复在 vxsnap prepare 失 败 后 恢 复如 果 vxsnap prepare 操 作 过 早 失 败 ,vxprint 命 令 可 能 以 INSTSNAPTMP 状 态 显示 新 的 DCO 卷 。VxVM 通 常 可 以 在 没 有 干 预 的 情 况 下 恢 复 DCO 卷 。 但 在 某 些 情 况下 , 此 恢 复 可 能 不 会 成 功 。 发 生 这 种 情 况 后 , 必 须 删 除 DCO 卷 。在 vxsnap prepare 命 令 失 败 后 恢 复◆ 键 入 以 下 命 令 :# vxedit [-g diskgroup] rm DCO_volume或 者 选 择 系 统 下 次 重 新 启 动 时 自 动 删 除 DCO 卷 。 将 DCO 卷 删 除 后 , 请 再 次 运行 vxsnap prepare 命 令 。


48在 即 时 快 照 故 障 后 恢 复在 对 完 整 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 对 完 整 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 创 建 完 整 空 间 即 时 快 照 的 过 程 中 , 如 果 vxsnap make 操 作 失 败 , 快 照 卷 可 能 会 变为 DISABLED 状 态 , 被 标 记 为 无 效 , 且 无 法 启 动 。 可 使 用 以 下 命 令 验 证inst_invalid 标 志 是 否 设 置 为 on:# vxprint [-g diskgroup] -F%inst_invalid snapshot_volumeVxVM 通 常 在 没 有 干 预 的 情 况 下 恢 复 快 照 卷 。 但 在 某 些 情 况 下 , 此 恢 复 可 能 不 会 成功 。 发 生 这 种 情 况 后 , 必 须 删 除 DCO 卷 。在 对 完 整 空 间 即 时 快 照 执 行 vxsnap make 命 令 失 败 后 恢 复1 清 除 快 照 卷 的 tutil0 字 段 。 输 入 以 下 命 令 :# vxmend [-g diskgroup] clear tutil0 snapshot_volume2 取 消 准 备 快 照 卷 。 输 入 以 下 命 令 :# vxsnap [-g diskgroup] unprepare snapshot_volume3 如 果 快 照 卷 处 于 DISABLED 状 态 , 请 启 动 快 照 卷 。 输 入 以 下 命 令 :# vxvol [-g diskgroup] start snapshot_volume4 再 次 为 快 照 操 作 准 备 快 照 卷 。 输 入 以 下 命 令 :# vxsnap [-g diskgroup] prepare snapshot_volume5 清 除 卷 的 tutil0 字 段 ( 如 果 已 设 置 )。 输 入 以 下 命 令 。# vxmend [-g diskgroup] clear tutil0 original_volume在 对 断 开 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 创 建 第 三 镜 像 断 开 即 时 快 照 的 过 程 中 , 如 果 vxsnap make 操 作 失 败 , 则 快 照 卷 可能 变 为 INSTSNAPTMP 状 态 。VxVM 通 常 可 以 在 没 有 干 预 的 情 况 下 恢 复 快 照 卷 。但 在 某 些 情 况 下 , 此 恢 复 可 能 不 会 成 功 。 发 生 这 种 情 况 后 , 必 须 删 除 快 照 卷 。在 对 断 开 即 时 快 照 执 行 vxsnap make 命 令 失 败 后 恢 复◆ 键 入 以 下 命 令 :# vxedit [-g diskgroup] rm snapshot_volume或 者 选 择 系 统 下 次 重 新 启 动 时 自 动 删 除 快 照 卷 。


在 即 时 快 照 故 障 后 恢 复在 对 优 化 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复49在 对 优 化 空 间 即 时 快 照 执 行 vxsnap make 失 败 后 恢 复在 创 建 优 化 空 间 即 时 快 照 的 过 程 中 , 如 果 vxsnap make 操 作 失 败 , 则 快 照 卷 可 能 变为 INSTSNAPTMP 状 态 。VxVM 通 常 可 以 在 没 有 干 预 的 情 况 下 恢 复 快 照 卷 。 但 在某 些 情 况 下 , 此 恢 复 可 能 不 会 成 功 。 发 生 这 种 情 况 后 , 必 须 删 除 快 照 卷 。在 对 优 化 空 间 即 时 快 照 执 行 vxsnap make 命 令 失 败 后 恢 复◆ 键 入 以 下 命 令 :# vxedit [-g diskgroup] rm snapshot_volume或 者 选 择 系 统 下 次 重 新 启 动 时 自 动 删 除 快 照 卷 。如 果 通 过 指 定 cache 属 性 , 对 准 备 好 的 缓 存 对 象 执 行 vxsnap make 操 作 , 则 删除 快 照 后 缓 存 对 象 保 持 不 变 。 如 果 使 用 cachesize 属 性 指 定 了 新 的 缓 存 对 象 ,删 除 快 照 后 该 缓 存 对 象 便 不 继 续 存 在 。在 vxsnap restore 失 败 后 恢 复如 果 vxsnap restore 操 作 失 败 , 所 还 原 的 卷 可 能 变 为 DISABLED 状 态 。在 vxsnap restore 命 令 失 败 后 恢 复◆ 键 入 以 下 命 令 :# vxvol [-g diskgroup] start volume在 vxsnap refresh 失 败 后 恢 复如 果 vxsnap refresh 操 作 失 败 , 则 在 恢 复 卷 后 VxVM 会 尝 试 重 新 开 始 同 步 。 卷 将启 动 , 同 步 在 后 台 进 行 。此 过 程 要 求 磁 盘 组 版 本 为 170 或 更 高 版 本 。所 刷 新 的 卷 可 能 变 为 DISABLED 状 态 、 被 标 记 为 无 效 且 无 法 启 动 。在 vxsnap refresh 命 令 失 败 后 恢 复1 使 用 以 下 命 令 检 查 是 否 将 inst_invalid 标 志 设 置 为 on:# vxprint [-g diskgroup] -F%inst_invalid volume2 使 用 vxmend 命 令 清 除 卷 的 tutil0 字 段 :# vxmend [-g diskgroup] clear tutil0 volume


50在 即 时 快 照 故 障 后 恢 复在 “ 写 入 时 复 制 ” 失 败 后 恢 复3 使 用 以 下 命 令 启 动 卷 :# vxvol [-g diskgroup] start volume4 再 次 运 行 失 败 的 refresh 命 令 。这 将 完 全 重 新 同 步 卷 。 或 者 选 择 在 需 要 时 删 除 快 照 卷 并 重 新 创 建 它 。在 “ 写 入 时 复 制 ” 失 败 后 恢 复如 果 执 行 内 部 的 卷 快 照 重 新 同 步 时 遇 到 错 误 , 则 快 照 卷 会 变 为 INVALID 状 态 , 并且 无 法 用 于 I/O 存 取 和 即 时 快 照 操 作 。在 “ 写 入 时 复 制 ” 失 败 后 恢 复1 使 用 vxsnap 命 令 将 卷 从 快 照 层 次 结 构 中 分 离 出 来 :# vxsnap [-g diskgroup] dis snapshot_volume2 使 用 以 下 命 令 取 消 卷 的 准 备 :# vxsnap [-g diskgroup] unprepare snapshot_volume3 使 用 以 下 命 令 准 备 卷 :# vxsnap [-g diskgroup] prepare volume [ndcomirs=number] \[regionsize=size] [drl=yes|no|sequential] \[storage_attribute ...]该 卷 现 在 可 以 再 次 用 于 快 照 操 作 。或 者 选 择 在 需 要 时 删 除 快 照 卷 并 重 新 创 建 它 。发 生 重 新 同 步 I/O 错 误 后 恢 复如 果 发 生 I/O 错 误 , 就 会 停 止 快 照 重 新 同 步 ( 通 过 vxsnap syncstart 或 为 vxsnap指 定 sync=on 启 动 ), 并 且 在 系 统 控 制 台 上 显 示 以 下 消 息 :VxVM vxsnap ERROR V-5-1-6840 Synchronization of the volumevolume stopped due to I/O error更 正 错 误 源 后 , 重 新 启 动 重 新 同 步 操 作 。


在 即 时 快 照 故 障 后 恢 复DCO 卷 发 生 I/O 故 障 后 恢 复51发 生 重 新 同 步 I/O 错 误 后 恢 复◆ 键 入 以 下 命 令 :# vxsnap [-b] [-g diskgroup] syncstart volumeDCO 卷 发 生 I/O 故 障 后 恢 复如 果 DCO 卷 上 发 生 I/O 故 障 , 则 无 法 访 问 它 的 快 速 重 同 步 映 射 和 DRL 日 志 , 并 且该 DCO 卷 被 用 BADLOG 标 志 做 了 标 记 。 除 非 恢 复 卷 的 DCO 卷 , 否 则 无 法 对 该 卷 执行 DRL 日 志 记 录 与 恢 复 以 及 即 时 快 照 操 作 。如 果 I/O 故 障 还 影 响 数 据 卷 , 则 必 须 先 恢 复 数 据 卷 , 然 后 才 能 恢 复 其 DCO 卷 。请 参 见 第 45 页 的 “ 恢 复 即 时 快 照 DCO 卷 ( 版 本 20 或 更 高 版 本 )”。从 对 即 时 快 照 数 据 更 改 对 象 (DCO) 执 行 vxsnap upgrade时 出 现 的 故 障 中 恢 复当 您 升 级 即 时 快 照 数 据 更 改 对 象 (DCO) 时 ,DCO 及 DCO 卷 将 就 地 升 级 。 如 果 DCO中 没 有 足 够 的 空 间 来 容 纳 升 级 后 的 新 DCO, 此 操 作 将 失 败 。如 果 此 操 作 因 缺 乏 空 间 而 失 败 , 请 采 用 以 下 方 法 之 一 :使 用 vxsnap upgrade 命 令 的 -f 选 项 。 指 定 了 -f 时 ,VxVM 将 使 用 磁 盘 组 中 的 任 意可 用 空 间 来 容 纳 升 级 后 的 新 DCO。 因 此 , 如 果 磁 盘 组 中 有 足 够 的 可 用 空 间 , 此 升 级操 作 便 可 能 会 成 功 。# vxsnap [-g diskgroup] -f upgrade[volume1|volset1][volume2|volset2...]使 用 alloc 属 性 指 定 要 用 来 保 存 新 DCO 的 存 储 。VxVM 将 在 指 定 的 存 储 上 创 建 新的 DCO。 有 关 存 储 属 性 的 信 息 , 请 参 见 vxsnap(m1) 手 册 页 。# vxsnap -g diskgroup upgrade[volume1|volset1][volume2|volset2...][alloc=storage_attributes]如 果 既 指 定 了 alloc 属 性 又 指 定 了 -f 选 项 ,VxVM 会 对 alloc 属 性 使 用 指 定 的 存储 。


52在 即 时 快 照 故 障 后 恢 复从 对 即 时 快 照 数 据 更 改 对 象 (DCO) 执 行 vxsnap upgrade 时 出 现 的 故 障 中 恢 复


5在 引 导 磁 盘 故 障 后 恢 复本 章 节 包 括 下 列 主 题 :■■■■■■VxVM 和 引 导 磁 盘 故 障通 过 从 VxVM 根 磁 盘 镜 像 引 导 恢 复 系 统恢 复 VxVM 引 导 磁 盘 采 用 本 机 多 径 处 理 的 系 统通 过 从 恢 复 介 质 引 导 来 恢 复 系 统启 动 VxVM 维 护 模 式 引 导通 过 重 新 安 装 来 恢 复VxVM 和 引 导 磁 盘 故 障<strong>Veritas</strong> Volume Manager (VxVM) 可 以 保 护 系 统 免 受 磁 盘 和 其 他 硬 件 故 障 的 影 响 ,并 帮 助 您 从 这 类 事 件 中 恢 复 。 恢 复 过 程 可 帮 助 防 止 因 引 导 (root) 磁 盘 故 障 导 致 数 据丢 失 或 无 法 访 问 系 统 。恢 复 引 导 磁 盘 上 的 卷 及 卷 中 数 据 的 过 程 有 别 于 用 于 非 引 导 磁 盘 的 过 程 。请 参 见 第 23 页 的 “ 关 于 硬 件 故 障 后 恢 复 ”。请 参 见 HP 文 档 网 站 http://docs.hp.com。单 击 Search This Site( 搜 索 此 站 点 ), 搜 索 Ignite-UX Administration Guide《Ignite-UX 管 理 指 南 》 并 选 择 相 应 11i 版 本 的 链 接 。 有 关 系 统 恢 复 操 作 的 信 息 ,请 选 择 System Recovery( 系 统 恢 复 )。 请 特 别 注 意 Expert Recovery Using theCore Media( 使 用 核 心 介 质 的 专 业 恢 复 ) 中 的 信 息 。通 过 从 VxVM 根 磁 盘 镜 像 引 导 恢 复 系 统如 果 出 现 故 障 的 主 引 导 磁 盘 受 VxVM 控 制 并 已 镜 像 , 则 必 须 将 其 替 换 。


54在 引 导 磁 盘 故 障 后 恢 复恢 复 VxVM 引 导 磁 盘 采 用 本 机 多 径 处 理 的 系 统通 过 从 VxVM 根 磁 盘 镜 像 引 导 恢 复 系 统1 替 换 出 现 故 障 的 磁 盘 。 此 操 作 可 能 会 要 求 您 关 闭 系 统 并 关 闭 系 统 电 源 , 视 系 统硬 件 而 定 。2 从 根 磁 盘 的 镜 像 引 导 系 统 , 使 用 vxrootmir 命 令 初 始 化 并 镜 像 新 根 磁 盘 上 的卷 :# /etc/vx/bin/vxrootmir -v -b new_root_disk_access_name-b 选 项 将 新 镜 像 的 磁 盘 设 置 为 NVRAM 中 的 备 用 引 导 磁 盘 。-v 选 项 在 镜 像 每个 卷 时 提 供 进 度 指 示 。恢 复 VxVM 引 导 磁 盘 采 用 本 机 多 径 处 理 的 系 统如 果 VxVM 引 导 磁 盘 采 用 本 机 多 径 处 理 的 系 统 无 法 引 导 , 请 从 备 用 引 导 磁 盘 引 导 该系 统 并 使 用 以 下 恢 复 过 程 。情 形 1系 统 无 法 引 导 。 以 下 消 息 显 示 在 控 制 台 或 syslog 中 :VxVM sysboot INFO : reading the krs value is successful value is 1VxVM sysboot INFO V-5-2-3811 Starting in boot mode要 从 这 样 的 故 障 ( 其 中 krs 值 显 示 为 1) 中 恢 复 系 统 , 请 从 备 用 引 导 磁 盘 引 导 系 统并 遵 循 下 面 给 出 的 步 骤 :1 # mkdir /mnt12 # fsck /dev/vx/dsk/dgname/rootvol其 中 dgname 是 包 含 受 影 响 的 引 导 磁 盘 的 磁 盘 组 的 名 称 。3 # mount /dev/vx/dsk/dgname/rootvol /mnt14 # echo "/dev/disk/* foreign a block /dev/rdisk/* \char" >> /mnt1/etc/vx/darecs5 # umount /mnt16 重 新 启 动 系 统情 形 2系 统 无 法 从 采 用 本 机 多 经 处 理 的 VxVM 引 导 磁 盘 引 导 。 控 制 台 或 syslog 中 显 示 krs值 为 0 的 相 似 消 息 :


在 引 导 磁 盘 故 障 后 恢 复通 过 从 恢 复 介 质 引 导 来 恢 复 系 统55VxVM sysboot INFO : reading the krs value is successful value is 0要 从 这 样 的 故 障 ( 其 中 krs 值 显 示 为 0) 中 恢 复 系 统 , 请 从 备 用 引 导 磁 盘 引 导 系 统并 遵 循 下 面 给 出 的 步 骤 :1 # mkdir /mnt12 # fsck /dev/vx/dsk/dgname/rootvol其 中 dgname 是 包 含 受 影 响 的 引 导 磁 盘 的 磁 盘 组 的 名 称 。3 # mount /dev/vx/dsk/dgname/rootvol /mnt14 # rm /mnt1/etc/vx/darecs5 # umount /mnt16 重 新 启 动 系 统通 过 从 恢 复 介 质 引 导 来 恢 复 系 统在 HP-UX 11i 版 本 3 中 , 如 果 从 VxVM 引 导 磁 盘 引 导 出 现 故 障 并 且 没 有 可 用 的 可引 导 根 镜 像 , 则 可 能 有 必 要 从 下 列 备 用 引 导 源 或 恢 复 介 质 引 导 :■ HP-UX 11i 版 本 3 安 装 光 盘 。■ 可 引 导 恢 复 磁 带 。■ 配 置 中 的 备 用 引 导 磁 盘 。■ 可 通 过 LAN 访 问 的 HP-UX Ignite-UX 服 务 器 。只 有 从 恢 复 介 质 引 导 系 统 , 才 能 修 复 以 下 问 题 :■ HP-UX 内 核 损 坏 或 不 可 引 导 。■ 引 导 所 必 需 的 文 件 丢 失 , 如 :■ /st<strong>and</strong>/ioconfig 文 件 。■ /dev/vx 中 的 设 备 文 件 。■ 引 导 磁 盘 上 的 LIF 区 域 损 坏 。有 关 如 何 从 以 上 情 况 恢 复 以 及 许 多 其 他 故 障 的 详 细 信 息 , 请 参 见 《Ignite-UX 管 理指 南 》, 此 文 档 可 通 过 HP 文 档 网 站 获 取 。如 果 这 些 方 法 失 败 , 请 通 过 重 新 安 装 过 程 恢 复 。请 参 见 第 59 页 的 “ 通 过 重 新 安 装 来 恢 复 ”。


56在 引 导 磁 盘 故 障 后 恢 复通 过 从 恢 复 介 质 引 导 来 恢 复 系 统从 恢 复 介 质 引 导 后 启 动 VxVM从 恢 复 介 质 引 导 系 统 后 , 可 使 用 vx_emerg_start 实 用 程 序 启 动 VxVM。 此 命 令 可在 发 生 灾 难 性 故 障 时 修 复 可 作 为 根 的 VxVM 配 置 。从 恢 复 介 质 引 导 后 启 动 VxVM◆ 键 入 以 下 命 令 :# vx_emerg_start hostnamehostname 参 数 指 定 要 恢 复 的 系 统 的 名 称 ( 节 点 名 称 )。 该 名 称 必 须 与 要 恢 复的 系 统 的 名 称 相 匹 配 , 因 为 它 不 太 可 能 记 录 在 从 中 引 导 系 统 的 恢 复 介 质 上 。


在 引 导 磁 盘 故 障 后 恢 复通 过 从 恢 复 介 质 引 导 来 恢 复 系 统57在 VxVM 紧 急 启 动 后 恢 复 根 卷在 VxVM 紧 急 启 动 后 恢 复 根 卷1 使 用 vx_emerg_start 启 动 VxVM 后 , 使 用 vxprint 命 令 确 定 配 置 状 态 。一 个 常 见 的 问 题 是 : 根 卷 rootvol 的 所 有 Plex 全 部 失 效 。 这 将 在 vxprint 输出 的 STATE 字 段 中 显 示 , 如 下 所 示 :TYNAME ASSOC KSTATE LENGTH PLOFFS STATE ...vrootvol root DISABLED 393216 - ACTIVE ...plrootvol-01 rootvol DISABLED 393216 - STALE ...sdrootdisk01-02rootvol-01 ENABLED 393216 0 - ...plrootvol-02 rootvol DISABLED 393216 - STALE ...sdrootdisk02-02rootvol-02 ENABLED 393216 0 - ...( 为 增 加 可 读 性 , 已 将 TUTIL0 和 PUTIL0 字 段 从 vxprint 输 出 中 删 除 。)2 通 常 , 可 使 用 以 下 命 令 修 复 根 卷 :# vxvol -g bootdg -f start rootvol如 果 根 卷 已 镜 像 , 则 恢 复 已 开 始 。 请 等 待 , 直 至 恢 复 完 成 , 命 令 退 出 。 然 后 运行 fsck 命 令 并 装 入 根 文 件 系 统 , 如 下 所 示 :# fsck -F vxfs -o full /dev/vx/rdsk/bootdg/rootvol# mkdir /tmp_mnt# mount -F vxfs /dev/vx/dsk/bootdg/rootvol /tmp_mnt以 下 形 式 的 vx_emerg_start 命 令 将 上 述 所 有 操 作 合 并 在 一 个 命 令 中 , 可 恢 复根 卷 及 其 镜 像 、 检 查 根 文 件 系 统 , 然 后 将 其 装 入 :# vx_emerg_start -m hostname3 在 修 复 VxVM 根 磁 盘 上 的 卷 并 执 行 所 有 其 他 必 要 修 复 后 , 重 新 启 动 系 统 :# reboot修 复 丢 失 或 损 坏 的 /etc/vx/volboot 文 件如 果 /etc/vx/volboot 文 件 丢 失 或 其 内 容 不 正 确 , 则 在 引 导 时 可 能 会 显 示 以 下 消息 :vxvm:vxconfigd: ERROR: enable failed: Volboot file not loadedtransactions are disabled.vxvm:vxconfigd: FATAL ERROR: Bootdg cannot be imported during


58在 引 导 磁 盘 故 障 后 恢 复启 动 VxVM 维 护 模 式 引 导bootError returned from vxconfigd -m boot, halting在 系 统 引 导 过 程 中 ,VxVM 配 置 后 台 驻 留 程 序 读 取 /etc/vx/volboot 文 件 。 如 果文 件 丢 失 或 损 坏 , 则 配 置 后 台 驻 留 程 序 将 失 败 , 并 中 止 引 导 过 程 。修 复 丢 失 或 损 坏 的 /etc/vx/volboot 文 件◆ 从 恢 复 介 质 重 新 启 动 系 统 并 运 行 以 下 命 令 :# vx_emerg_start -m hostname此 命 令 确 定 volboot 文 件 是 否 存 在 , 若 不 存 在 则 将 其 重 新 写 入 。启 动 VxVM 维 护 模 式 引 导在 VxVM 引 导 磁 盘 上 执 行 有 限 恢 复 的 另 一 方 法 是 使 用 VxVM 维 护 模 式 引 导 (MMB)。启 动 VxVM MMB◆从 主 引 导 设 备 或 辅 助 引 导 设 备 引 导 系 统 , 并 在 ISL 引 导 提 示 符 位 置 输 入 以 下 命令 :hpux -vm这 会 使 引 导 加 载 程 序 和 HP-UX 内 核 在 查 找 引 导 系 统 所 必 需 的 部 件 时 采 取 备 用操 作 。引 导 加 载 程 序 开 始 在 1KB 块 3168 处 读 取 st<strong>and</strong> 文 件 系 统 , 而 不 是 通 过 LIF 标签 定 位 。VxVM 内 核 根 目 录 可 置 性 代 码 使 用 /st<strong>and</strong>/rootconf 文 件 中 的 根 卷扩 展 信 息 来 设 置 根 卷 的 扩 展 , 并 指 示 init 系 统 启 动 时 进 入 单 用 户 模 式 。 从pre_init_rc 脚 本 调 用 时 , 如 果 vxconfigd 后 台 驻 留 程 序 通 过 内 核 确 定 系 统 处于 MMB 模 式 , 则 该 程 序 正 常 退 出 。 系 统 在 只 装 入 root 卷 的 情 况 下 运 行 ,VxVM在 临 时 对 象 指 向 root 卷 的 情 况 下 运 行 。警 告 : 正 常 情 况 下 ,VxVM 配 置 后 台 驻 留 程 序 vxconfigd 不 在 MMB 模 式 下 运行 , 只 使 用 根 卷 数 据 的 一 个 副 本 。 如 果 系 统 具 有 镜 像 的 根 卷 , 则 在 随 后 配 置 两个 镜 像 时 写 入 root 文 件 系 统 可 能 会 导 致 文 件 系 统 损 坏 。 为 防 止 这 种 情 况 的 发生 , 可 通 过 运 行 vx_emerg_start 命 令 在 MMB 模 式 下 启 动 VxVM。 这 会 将 非引 导 镜 像 Plex 标 记 为 失 效 , 从 而 强 制 从 引 导 镜 像 恢 复 到 非 引 导 镜 像 。 在 MMB模 式 下 启 动 VxVM 后 , 可 根 据 问 题 的 特 性 执 行 不 同 的 恢 复 选 项 。请 参 见 vx_emerg_start(1M) 手 册 页 。


在 引 导 磁 盘 故 障 后 恢 复通 过 重 新 安 装 来 恢 复59通 过 重 新 安 装 来 恢 复如 果 通 过 Ignite-UX 安 装 时 配 置 了 VxVM 根 目 录 可 置 性 , 则 在 恢 复 出 现 故 障 的 引 导磁 盘 时 , 通 常 通 过 保 存 的 Ignite-UX 配 置 重 新 安 装 即 可 。请 参 见 《Ignite-UX 管 理 指 南 》。如 果 引 导 (root) 磁 盘 的 所 有 副 本 均 损 坏 , 或 某 些 关 键 文 件 因 文 件 系 统 损 坏 而 丢 失 ,则 必 须 完 整 地 重 新 安 装 该 软 件 。 如 果 出 现 上 述 类 型 的 故 障 , 则 无 需 重 新 配 置 故 障 中未 直 接 涉 及 的 卷 。在 HP-UX 11i 版 本 3 系 统 中 , 通 过 从 VxVM 根 磁 盘 镜 像 或 恢 复 介 质 引 导 来 恢 复 系统 更 为 可 取 。请 参 见 第 53 页 的 “ 通 过 从 VxVM 根 磁 盘 镜 像 引 导 恢 复 系 统 ”。请 参 见 第 55 页 的 “ 通 过 从 恢 复 介 质 引 导 来 恢 复 系 统 ”。


60在 引 导 磁 盘 故 障 后 恢 复通 过 重 新 安 装 来 恢 复


6管 理 命 令 和 事 务本 章 节 包 括 下 列 主 题 :■■■■■命 令 日 志事 务 日 志命 令 日 志 和 事 务 日 志 的 关 联将 从 从 属 节 点 发 出 的 CVM 命 令 关 联 到 主 节 点未 启 用 命 令 完 成命 令 日 志使 用 vxcmdlog 命 令 可 以 将 其 他 <strong>Veritas</strong> Volume Manager (VxVM) 命 令 的 调 用 操 作记 录 到 文 件 中 。下 面 举 例 说 明 vxcmdlog 的 用 法 :vxcmdlog -lvxcmdlog -m onvxcmdlog -s 512kvxcmdlog -n 10vxcmdlog -n no_limitvxcmdlog -m off列 出 命 令 日 志 记 录 的 当 前 设 置 。打 开 命 令 日 志 记 录 功 能 。将 最 大 命 令 日 志 文 件 大 小 设 置 为 512K。将 最 大 历 史 命 令 日 志 文 件 数 设 置 为 10。取 消 对 历 史 命 令 日 志 文 件 数 的 限 制 。关 闭 命 令 日 志 记 录 功 能 。默 认 情 况 下 , 命 令 日 志 记 录 处 于 打 开 状 态 。 命 令 行 将 记 录 到 /etc/vx/log 目 录 下 的cmdlog 文 件 中 。 此 路 径 名 是 一 个 指 向 目 录 的 符 号 链 接 , 目 录 的 位 置 与 操 作 系 统 有关 。 必 要 时 可 以 重 新 定 义 所 链 接 的 目 录 。


62管 理 命 令 和 事 务命 令 日 志如 果 要 保 留 vxcmdlog 实 用 程 序 的 设 置 , 还 必 须 将 设 置 文 件 .cmdlog 复 制 到 新 的 目录 。警 告 :.cmdlog 文 件 是 一 个 二 进 制 文 件 , 不 应 对 其 进 行 编 辑 。在 写 入 一 个 条 目 ( 因 此 导 致 实 际 大 小 可 能 略 大 于 指 定 的 大 小 ) 之 后 , 系 统 将 检 查 命令 日 志 的 大 小 。 当 日 志 达 到 最 大 空 间 时 , 当 前 命 令 日 志 文 件 cmdlog 被 重 命 名 为 下一 个 可 用 的 历 史 日 志 文 件 cmdlog.number( 其 中 number 是 一 个 整 数 , 其 范 围 为 从1 到 当 前 定 义 的 最 大 历 史 日 志 文 件 数 ), 并 且 新 创 建 一 个 当 前 日 志 文 件 。为 了 避 免 写 满 文 件 系 统 , 系 统 仅 保 留 有 限 数 量 的 历 史 日 志 文 件 。 如 果 达 到 最 大 历 史日 志 文 件 数 , 则 删 除 最 早 的 历 史 日 志 文 件 , 并 将 当 前 的 日 志 文 件 重 命 名 为 该 文 件 。每 个 日 志 文 件 都 包 含 一 个 标 头 , 其 中 记 录 了 主 机 名 、 主 机 ID 以 及 日 志 的 创 建 日 期和 时 间 。下 面 是 摘 自 一 个 命 令 日 志 文 件 的 示 例 条 目 :# 0, 2329, Wed Feb 12 21:19:31 2003/usr/sbin/vxdctl mode# 17051, 2635, Wed Feb 12 21:19:33 2003/usr/sbin/vxdisk -q -o alldgs list# 0, 2722, Wed Feb 12 21:19:34 2003/etc/vx/diag.d/vxprivutil dumpconfig /dev/vx/rdmp/Disk_4# 26924, 3001, Thu Feb 13 19:30:57 2003/usr/sbin/vxdisk list Disk_1每 个 条 目 通 常 包 含 客 户 端 ID( 标 识 vxconfigd 后 台 驻 留 程 序 的 命 令 连 接 )、 当 前运 行 的 命 令 的 进 程 ID、 时 间 戳 以 及 包 含 任 何 参 数 的 命 令 行 。如 果 客 户 端 ID 是 0( 如 上 例 中 的 第 三 条 ), 则 说 明 该 命 令 未 打 开 与 vxconfigd 的连 接 。该 客 户 端 ID 与 在 事 务 日 志 中 为 相 应 事 务 记 录 的 客 户 端 ID 相 同 。请 参 见 第 63 页 的 “ 事 务 日 志 ”。请 参 见 第 64 页 的 “ 命 令 日 志 和 事 务 日 志 的 关 联 ”。大 多 数 命 令 脚 本 不 会 被 记 录 , 但 它 们 调 用 的 命 令 二 进 制 文 件 会 被 记 录 。vxdisksetup、vxinstall 和 vxdiskunsetup 脚 本 例 外 , 系 统 会 记 录 这 些 脚 本 。如 果 读 取 设 置 文 件 时 发 生 错 误 , 命 令 日 志 记 录 将 切 换 到 内 置 的 默 认 设 置 。 这 可 能 意味 着 某 些 情 况 , 例 如 在 使 用 vxcmdlog -m off 命 令 禁 用 日 志 记 录 后 , 日 志 记 录 仍 保持 启 用 状 态 。 如 果 发 生 这 种 情 况 , 请 使 用 vxcmdlog 实 用 程 序 重 新 创 建 设 置 文 件 ,或 使 用 备 份 还 原 此 文 件 。请 参 见 vxcmdlog(1M) 手 册 页 。


管 理 命 令 和 事 务事 务 日 志63事 务 日 志可 以 使 用 vxtranslog 命 令 将 VxVM 事 务 记 录 到 文 件 中 。下 面 举 例 说 明 vxtranslog 的 用 法 :vxtranslog -lvxtranslog -m onvxtranslog -s 512kvxtranslog -n 10vxtranslog -n no_limitvxtranslog -q onvxtranslog -q offvxtranslog -m off列 出 事 务 日 志 记 录 的 当 前 设 置 。打 开 事 务 日 志 记 录 功 能 。将 最 大 事 务 日 志 文 件 大 小 设 置 为 512K。将 最 大 历 史 事 务 日 志 文 件 数 设 置 为 10。取 消 对 历 史 事 务 日 志 文 件 数 的 限 制 。打 开 查 询 日 志 记 录 功 能 。关 闭 查 询 日 志 记 录 功 能 。关 闭 事 务 日 志 记 录 功 能 。默 认 情 况 下 , 事 务 日 志 记 录 处 于 打 开 状 态 。 事 务 将 记 录 到 /etc/vx/log 目 录 下 的translog 文 件 中 。 此 路 径 名 是 一 个 指 向 目 录 的 符 号 链 接 , 目 录 的 位 置 与 操 作 系 统有 关 。 必 要 时 可 以 重 新 定 义 所 链 接 的 目 录 。 如 果 要 保 留 vxtranslog 实 用 程 序 的 设置 , 还 必 须 将 设 置 文 件 .translog 复 制 到 新 的 目 录 。警 告 :.translog 文 件 是 一 个 二 进 制 文 件 , 不 应 对 其 进 行 编 辑 。在 写 入 一 个 条 目 ( 因 此 导 致 实 际 大 小 可 能 略 大 于 指 定 的 大 小 ) 之 后 , 系 统 将 检 查 事务 日 志 的 大 小 。 当 日 志 达 到 最 大 空 间 时 , 当 前 事 务 日 志 文 件 translog 被 重 命 名 为下 一 个 可 用 的 历 史 日 志 文 件 translog.number( 其 中 number 是 一 个 整 数 , 其 范 围为 从 1 到 当 前 定 义 的 最 大 历 史 日 志 文 件 数 ), 并 且 新 创 建 一 个 当 前 日 志 文 件 。为 了 避 免 写 满 文 件 系 统 , 系 统 仅 保 留 有 限 数 量 的 历 史 日 志 文 件 。 如 果 达 到 最 大 历 史日 志 文 件 数 , 则 删 除 最 早 的 历 史 日 志 文 件 , 并 将 当 前 的 日 志 文 件 重 命 名 为 该 文 件 。每 个 日 志 文 件 都 包 含 一 个 标 头 , 其 中 记 录 了 主 机 名 、 主 机 ID 以 及 日 志 的 创 建 日 期和 时 间 。下 面 是 摘 自 一 个 事 务 日 志 文 件 的 示 例 条 目 :Fri Oct 17 13:23:30 2003Clid = 23460, PID = 21240, Part = 0, Status = 0, Abort Reason = 0DA_GETDisk_0DISK_GET_ATTRSDisk_0DISK_DISK_OP Disk_0 8


64管 理 命 令 和 事 务命 令 日 志 和 事 务 日 志 的 关 联DEVNO_GETDANAME_GETGET_ARRAYNAMEDisk_00x160045 0x160072Disk DISKSCTLR_PTOLNAME 11-08-01GET_ARRAYNAMEDisk DISKSCTLR_PTOLNAME 21-08-01DROPPED每 个 日 志 条 目 的 第 一 行 是 事 务 的 时 间 戳 。Clid 字 段 与 该 命 令 打 开 的 vxconfigd 连接 的 客 户 端 ID 相 对 应 。PID 字 段 显 示 正 在 请 求 操 作 的 实 用 程 序 的 进 程 ID。 如 果 事务 未 正 常 完 成 ,Status 和 Abort Reason 字 段 将 包 含 错 误 代 码 。 记 录 的 其 余 部 分 将显 示 处 理 事 务 时 使 用 的 数 据 。该 客 户 端 ID 与 在 命 令 日 志 中 为 对 应 命 令 行 所 记 录 的 客 户 端 ID 相 同 。请 参 见 第 61 页 的 “ 命 令 日 志 ”。请 参 见 第 64 页 的 “ 命 令 日 志 和 事 务 日 志 的 关 联 ”。如 果 读 取 设 置 文 件 时 发 生 错 误 , 事 务 日 志 记 录 将 切 换 到 内 置 的 默 认 设 置 。 这 可 能 意味 着 某 些 情 况 , 例 如 在 使 用 vxtranslog -m off 命 令 禁 用 日 志 记 录 后 , 日 志 记 录仍 保 持 启 用 状 态 。 如 果 发 生 这 种 情 况 , 请 使 用 vxtranslog 实 用 程 序 重 新 创 建 设 置文 件 , 或 使 用 备 份 还 原 此 文 件 。命 令 日 志 和 事 务 日 志 的 关 联为 每 个 请 求 和 命 令 记 录 的 客 户 端 ID 和 进 程 ID 可 帮 助 您 将 命 令 日 志 和 事 务 日 志 中 的条 目 关 联 起 来 。 要 确 定 事 务 日 志 中 的 某 个 请 求 是 哪 个 命 令 发 出 的 , 可 使 用 如 下 命 令在 命 令 日 志 中 搜 索 进 程 ID 和 客 户 端 ID:# egrep -n PID cmdlog | egrep Clid在 本 例 中 , 事 务 日 志 内 记 录 了 以 下 请 求 :Wed Feb 12 21:19:36 2003Clid = 8309, PID = 2778, Part = 0, Status = 0, Abort Reason = 0DG_IMPORT foodgDG_IMPORT foodgDISCONNECT 要 找 到 发 出 此 请 求 的 实 用 程 序 , 可 使 用 如 下 命 令 :# egrep -n 2778 cmdlog | egrep 83097310:# 8309, 2778, Wed Feb 12 21:19:36 2003


管 理 命 令 和 事 务将 从 从 属 节 点 发 出 的 CVM 命 令 关 联 到 主 节 点65该 示 例 输 出 表 明 命 令 日 志 第 7310 行 上 存 在 匹 配 项 。 通 过 检 查 命 令 日 志 中 的 第 7310行 和 7311 行 发 现 , 系 统 对 foodg 磁 盘 组 运 行 过 vxdg import 命 令 :# sed -e ’7310,7311!d’ cmdlog# 8309, 2778, Wed Feb 12 21:19:36 2003 7311/usr/sbin/vxdg -m import foodg如 果 客 户 端 ID 和 进 程 ID 的 组 合 有 多 个 匹 配 项 , 可 以 通 过 检 查 时 间 戳 来 确 定 正 确 的匹 配 项 。当 实 用 程 序 打 开 与 vxconfigd 的 条 件 连 接 时 , 其 客 户 端 ID 在 命 令 日 志 中 显 示 为 零 ,而 在 事 务 日 志 中 显 示 为 非 零 值 。 这 种 情 况 下 , 可 以 使 用 进 程 ID 和 时 间 戳 关 联 日 志条 目 。将 从 从 属 节 点 发 出 的 CVM 命 令 关 联 到 主 节 点在 CVM 从 属 节 点 上 运 行 用 于 更 改 共 享 磁 盘 组 配 置 的 命 令 时 ,CVM 会 将 这 些 命 令 传送 到 CVM 主 节 点 进 行 执 行 。例 如 , 在 从 属 节 点 上 运 行 以 下 命 令 , 以 在 共 享 磁 盘 组 中 创 建 一 个 卷 。CVM 会 将 该 命令 传 送 到 主 节 点 , 且 CVM 会 在 主 节 点 上 执 行 该 命 令 。# vxassist -g shareddg make shared-vol1 200M在 CVM 从 属 节 点 上 , 输 入 以 下 命 令 可 从 事 务 日 志 (translog) 中 识 别 传 送 的 命 令 :# egrep CMDSHIP_REQUEST translog在 本 示 例 中 , 以 下 条 目 记 录 在 从 属 节 点 上 的 事 务 日 志 中 :Thu Jul 15 06:30:16 2010Clid = 5302, PID = 589906, Part = 0, Status = 0, Abort Reason = 0DG_SET_CURRENT_IDDG_SET_CURRENTDG_GETCFG_IDDG_GETCFG_NAMEDG_SET_CURRENT_IDDG_SET_CURRENTDG_SET_CURRENT_IDDG_SET_CURRENTDG_GETCFG_ALLDG_GETCFG_ALLVOL_TRANSDG_GET_DEFAULTshareddgshareddg0xdde49f shareddg0xdde49f shareddgshareddgshareddgshareddgshareddg0x4200x420ds4700-0_7 ds4700-0_3 ds4700-0_CMDSHIP_REQUEST Comm<strong>and</strong> Shipped = /usr/sbin/vxassist -g


66管 理 命 令 和 事 务将 从 从 属 节 点 发 出 的 CVM 命 令 关 联 到 主 节 点shareddg make shared-vol1 200MDefault dg = nodgDROPPED 要 查 找 在 从 属 节 点 上 发 出 此 请 求 的 实 用 程 序 , 请 输 入 以 下 命 令 :# egrep -n PID cmdlog | egrep Clid在 本 示 例 中 , 输 入 以 下 命 令 :# egrep -n 589906 cmdlog | egrep 53027310#: 5302, 589906, Thu Jul 15 06:30:14 2010 /usr/sbin/vxassist -g该 示 例 输 出 表 明 命 令 日 志 第 7310 行 上 存 在 匹 配 项 。 通 过 检 查 命 令 日 志 中 的 第 7310行 和 7311 行 发 现 , 系 统 对 shareddg 磁 盘 组 运 行 过 vxassist make 命 令 :# sed -e ’7310,7311!d’ cmdlog# 5302, 589906, Thu Jul 15 06:30:14 2010/usr/sbin/vxassist -g shareddg make shared-vol1 200M要 确 定 从 属 节 点 的 集 群 监 视 器 nodeid (CM nid), 请 输 入 以 下 命 令 :# /etc/vx/bin/vxclustadm nidmap如 果 该 命 令 使 用 磁 盘 访 问 (DA) 名 称 , 传 送 的 命 令 会 将 DA 名 称 转 换 为 唯 一 磁 盘 ID(UDID) 或 磁 盘 介 质 (DM) 名 称 。 在 CVM 主 节 点 上 ,vxconfigd 日 志 将 显 示 接 收 到 的命 令 的 条 目 。 要 在 主 节 点 上 确 定 自 从 属 节 点 接 收 到 的 命 令 , 请 输 入 以 下 命 令 :# egrep CMDSHIP_REQUEST /var/adm/messages注 意 :vxconfigd 消 息 记 录 到 的 文 件 可 能 随 重 定 向 消 息 的 位 置 而 变 化 。在 本 示 例 中 , 以 下 接 收 到 的 命 令 将 记 录 在 主 节 点 上 的 vxconfigd 日 志 中 :07/15 06:29:02: V-5-1-0 receive_cmdship_message:CMDSHIP_REQUEST: Received comm<strong>and</strong>:Text - /usr/sbin/vxassist -g shareddg make shared-vol1 200M len = 53CLID = 5302 SlaveID = 0 Defaultdg = nodgCVM 主 节 点 将 执 行 接 收 到 的 命 令 并 将 响 应 发 送 到 从 属 节 点 。要 查 找 主 节 点 发 送 到 从 属 节 点 的 响 应 , 请 在 主 节 点 上 输 入 以 下 命 令 :# egrep CMDSHIP_RESPONSE translog | egrep Slave-Clid


管 理 命 令 和 事 务未 启 用 命 令 完 成67在 本 示 例 中 , 输 入 以 下 命 令 查 找 主 节 点 发 送 的 响 应 :# egrep CMDSHIP_RESPONSE translog | egrep 5302Thu Jul 15 06:29:03 2010Clid = 27741, PID = 475212, Part = 0, Status = 0, Abort Reason = 0CMDSHIP_RESPONSE SlaveCLID = 5302 SlaveCMID = 0ExitCode = 12 Flags = 1 stdoutlen = 0 stderrlen = 98 Response =VxVM vxassist ERROR V-5-1-10127 creating volume shared-vol1:Record already exists in disk groupDROPPED未 启 用 命 令 完 成如 果 Tab 键 未 自 动 完 成 命 令 , 请 检 查 以 下 几 点 :■ 该 命 令 必 须 位 于 支 持 的 命 令 列 表 中 。有 关 支 持 的 命 令 列 表 , 请 参 见 产 品 版 本 说 明 。■ 该 shell 必 须 为 bash 2.4 版 或 更 高 版 本 。如 果 满 足 上 述 要 求 , 则 可 能 是 bash 完 成 条 目 已 从 bashrc 或 bash_profile 中 删 除 。启 用 命 令 完 成◆ 运 行 以 下 命 令 :# . /etc/bash_completion.d/vx_bash


68管 理 命 令 和 事 务未 启 用 命 令 完 成


7备 份 和 还 原 磁 盘 组 配 置本 章 节 包 括 下 列 主 题 :■■■关 于 磁 盘 组 配 置 备 份备 份 磁 盘 组 配 置还 原 磁 盘 组 配 置关 于 磁 盘 组 配 置 备 份备 份 和 还 原 磁 盘 组 配 置 的 功 能 用 于 备 份 和 还 原 <strong>Veritas</strong> Volume Manager (VxVM) 磁盘 组 以 及 在 磁 盘 组 内 配 置 的 VxVM 对 象 ( 例 如 卷 ) 的 所 有 配 置 数 据 。 利 用 此 功 能 ,您 可 以 恢 复 损 坏 的 、 以 元 数 据 形 式 存 储 在 VM 磁 盘 专 用 区 域 中 的 磁 盘 组 配 置 。 当 还原 磁 盘 组 配 置 并 启 用 卷 后 , 您 不 必 从 备 份 介 质 中 还 原 , 公 共 区 域 中 的 用 户 数 据 就 又可 以 使 用 了 。警 告 : 备 份 和 还 原 实 用 程 序 仅 对 VxVM 配 置 数 据 起 作 用 。 它 们 不 备 份 或 还 原 卷 或 其他 VxVM 对 象 中 包 含 的 任 何 用 户 数 据 或 应 用 程 序 数 据 。 如 果 对 磁 盘 使 用vxdiskunsetup 和 vxdisksetup, 并 指 定 与 配 置 备 份 中 不 同 的 属 性 , 可 能 会 损 坏 公共 区 域 及 其 包 含 的 所 有 数 据 。vxconfigbackupd 后 台 驻 留 程 序 监 视 对 VxVM 配 置 所 做 的 更 改 , 并 在 大 约 一 小 时后 自 动 记 录 发 生 的 任 何 配 置 更 改 。vxconfigbackup 和 vxconfigrestore 这 两 个 实用 程 序 可 以 用 来 备 份 和 还 原 磁 盘 组 的 VxVM 配 置 。导 入 磁 盘 组 时 , 如 果 vxconfigd 日 志 中 存 在 以 下 任 何 错 误 , 则 说 明 磁 盘 组 配 置 和 /或 磁 盘 专 用 区 域 头 文 件 已 损 坏 :VxVM vxconfigd ERROR V-5-1-569 Disk group group,Disk disk:Cannotauto-import group: reason该 错 误 的 原 因 通 常 是 以 下 项 目 之 一 :


70备 份 和 还 原 磁 盘 组 配 置备 份 磁 盘 组 配 置Configuration records are inconsistentDisk group has no valid configuration copiesDuplicate record in configurationErrors in some configuration copiesFormat error in configuration copyInvalid block numberInvalid magic number如 果 VxVM 因 磁 盘 出 错 而 无 法 更 新 磁 盘 组 配 置 , 它 将 禁 用 该 磁 盘 组 并 显 示 以 下 错误 :VxVM vxconfigd ERROR V-5-1-123 Disk group group: Disabled by errors如 果 出 现 这 样 的 错 误 , 可 以 在 解 决 根 本 问 题 ( 如 硬 件 故 障 或 连 接 断 开 ) 后 从 备 份 还原 磁 盘 组 配 置 。使 用 备 份 中 的 配 置 数 据 , 您 可 以 重 新 安 装 磁 盘 组 中 头 文 件 损 坏 的 VxVM 磁 盘 的 专 用区 域 头 文 件 , 重 新 创 建 损 坏 的 磁 盘 组 配 置 , 或 者 重 新 创 建 磁 盘 组 和 磁 盘 组 中 的 VxVM对 象 。 如 果 原 来 的 系 统 不 可 用 , 您 还 可 以 使 用 配 置 数 据 在 其 他 系 统 上 重 新 创 建 磁 盘组 。注 意 : 要 还 原 磁 盘 组 配 置 , 所 使 用 的 物 理 磁 盘 必 须 与 在 执 行 备 份 时 在 磁 盘 组 中 配 置的 物 理 磁 盘 相 同 。请 参 见 第 70 页 的 “ 备 份 磁 盘 组 配 置 ”。请 参 见 第 71 页 的 “ 还 原 磁 盘 组 配 置 ”。备 份 磁 盘 组 配 置VxVM 使 用 磁 盘 组 配 置 后 台 驻 留 程 序 来 监 视 磁 盘 组 的 配 置 , 并 在 配 置 发 生 变 化 后 一小 时 进 行 备 份 。 执 行 此 操 作 的 目 的 是 为 了 避 免 在 较 短 的 时 间 间 隔 内 触 发 多 次 备 份 处理 。 默 认 情 况 下 , 系 统 将 保 留 最 近 的 五 个 备 份 。 备 份 放 置 在 以 下 位置 :/etc/vx/cbr/bk/diskgroup.dgid/bkp_YYYYMMDDD_HHMMSS/。 此 格 式 可 帮 助您 根 据 备 份 时 间 从 特 定 备 份 还 原 磁 盘 组 。 必 要 时 您 还 可 以 通 过 运 行 vxconfigbackup命 令 来 备 份 磁 盘 组 配 置 。以 下 文 件 记 录 磁 盘 组 配 置 信 息 :/etc/vx/cbr/bk/diskgroup.dgid/dgid.dginfo/etc/vx/cbr/bk/diskgroup.dgid/dgid.diskinfo磁 盘 组 信 息 。磁 盘 属 性 。


备 份 和 还 原 磁 盘 组 配 置还 原 磁 盘 组 配 置71/etc/vx/cbr/bk/diskgroup.dgid/dgid.binconfig/etc/vx/cbr/bk/diskgroup.dgid/dgid.cfgrec二 进 制 配 置 副 本 。vxprint -m 格 式 的 配 置 记 录 。此 处 的 diskgroup 表 示 磁 盘 组 名 称 ,dgid 表 示 磁 盘 组 ID。 如 果 要 在 其 他 系 统 上 重 新创 建 磁 盘 组 , 请 将 这 些 文 件 复 制 到 该 系 统 。警 告 : 请 注 意 不 要 重 写 目 标 系 统 上 由 该 系 统 中 的 磁 盘 组 使 用 的 任 何 文 件 。备 份 磁 盘 组 配 置◆ 键 入 以 下 命 令 :# /etc/vx/bin/vxconfigbackup [-f] [-l directory] [[diskgroup ...] |[dgid ...]]diskgroup(s)-f-l可 以 按 名 称 或 ID 指 定 磁 盘 组-f 选 项 用 于 强 制 完 全 备 份-l 选 项 用 于 为 备 份 配 置 文 件 位 置 ( 而 非 默 认 位 置/etc/vx/cbr/bk) 指 定 一 个 目 录 。要 备 份 所 有 磁 盘 组 , 请 使 用 此 版 本 的 命 令 :# /etc/vx/bin/vxconfigbackup [-f] [-l directory]请 参 见 vxconfigbackup(1M) 手 册 页 。还 原 磁 盘 组 配 置可 以 使 用 vxconfigrestore 实 用 程 序 从 磁 盘 组 的 配 置 备 份 中 还 原 或 重 新 创 建 磁 盘组 。 还 原 过 程 包 括 预 提 交 操 作 , 后 跟 提 交 操 作 。 在 预 提 交 阶 段 , 您 可 以 检 查 将 从 备份 中 还 原 的 磁 盘 组 配 置 。 在 您 选 择 提 交 更 改 后 , 实 际 的 磁 盘 组 配 置 才 永 久 还 原 。警 告 : 在 执 行 还 原 时 , 磁 盘 组 中 的 任 何 磁 盘 或 VxVM 对 象 不 能 被 任 何 应 用 程 序 打 开或 使 用 。在 预 提 交 阶 段 , 您 可 以 选 择 是 否 重 新 安 装 损 坏 的 磁 盘 头 文 件 。 如 果 有 任 何 磁 盘 的 专用 区 域 头 文 件 无 效 , 就 必 须 重 新 安 装 受 影 响 的 磁 盘 的 头 文 件 , 否 则 还 原 可 能 无 法 进行 。请 参 见 vxconfigrestore(1M) 手 册 页 。


72备 份 和 还 原 磁 盘 组 配 置还 原 磁 盘 组 配 置执 行 预 提 交 操 作◆请 使 用 以 下 命 令 执 行 磁 盘 组 配 置 状 态 的 预 提 交 分 析 , 并 在 头 文 件 已 损 坏 的 磁 盘上 重 新 安 装 磁 盘 头 文 件 :# /etc/vx/bin/vxconfigrestore -p [-l directory] \{diskgroup | dgid}可 以 通 过 名 称 或 ID 来 指 定 磁 盘 组 。使 用 -l 选 项 可 以 为 备 份 配 置 文 件 指 定 一 个 默 认 位 置 /etc/vx/cbr/bk 以 外 的 目录 。请 参 见 第 70 页 的 “ 备 份 磁 盘 组 配 置 ”。指 定 不 重 新 安 装 磁 盘 头 文 件◆ 键 入 以 下 命 令 :# /etc/vx/bin/vxconfigrestore -n [-l directory] \{diskgroup | dgid}在 预 提 交 阶 段 , 可 以 使 用 vxprint 命 令 检 查 所 还 原 的 磁 盘 组 将 具 有 的 配 置 。 可以 选 择 继 续 提 交 更 改 并 还 原 磁 盘 组 配 置 , 也 可 以 在 做 出 任 何 永 久 更 改 之 前 取 消还 原 。在 预 提 交 阶 段 放 弃 还 原◆ 键 入 以 下 命 令 :# /etc/vx/bin/vxconfigrestore -d [-l directory] \{diskgroup | dgid}


备 份 和 还 原 磁 盘 组 配 置还 原 磁 盘 组 配 置73执 行 提 交 操 作◆ 要 提 交 还 原 磁 盘 组 配 置 所 需 的 更 改 , 请 使 用 以 下 命 令 :# /etc/vx/bin/vxconfigrestore -c [-l directory] \{diskgroup | dgid}注 意 : 在 预 提 交 和 提 交 状 态 之 间 , 不 应 尝 试 任 何 导 致 磁 盘 组 配 置 发 生 更 改 的 操作 。 这 可 能 会 导 致 意 外 行 为 。 用 户 应 放 弃 还 原 , 或 者 提 交 此 操 作 。如 果 没 有 重 新 安 装 任 何 磁 盘 头 文 件 , 则 磁 盘 专 用 区 域 中 的 配 置 副 本 会 从 为 磁 盘组 保 存 的 最 新 二 进 制 配 置 副 本 进 行 更 新 。如 果 重 新 安 装 了 磁 盘 头 文 件 , 则 会 使 用 磁 盘 属 性 的 已 保 存 副 本 重 新 创 建 其 专 用区 域 和 公 共 区 域 。 系 统 还 会 为 这 些 磁 盘 分 配 新 的 磁 盘 ID。 然 后 , 使 用 磁 盘 组 的备 份 配 置 记 录 重 新 创 建 磁 盘 组 中 的 VxVM 对 象 。 此 过 程 还 将 在 磁 盘 组 中 创 建 新配 置 副 本 。卷 在 后 台 同 步 。 对 于 大 卷 的 配 置 , 执 行 同 步 可 能 需 要 一 些 时 间 。 可 以 使 用 vxtask-l list 命 令 监 视 此 操 作 的 进 度 。正 在 使 用 或 布 局 已 更 改 的 磁 盘 不 会 包 括 在 还 原 过 程 中 。如 果 备 份 是 从 共 享 磁 盘 组 创 建 的 ,vxconfigrestore 命 令 会 将 其 还 原 为 专 用 磁 盘组 。 在 还 原 磁 盘 组 后 , 请 运 行 以 下 命 令 以 便 共 享 磁 盘 组 。共 享 磁 盘 组1 逐 出 磁 盘 组 :# vxdg deport dg_name2 将 磁 盘 组 作 为 共 享 磁 盘 组 导 入 :# vxdg -s import dg_name解 决 磁 盘 组 的 冲 突 备 份有 时 , 系 统 上 的 磁 盘 已 更 换 , 磁 盘 组 可 能 有 几 个 冲 突 备 份 。 在 这 种 情 况 下 ,vxconfigrestore 命 令 会 显 示 如 下 信 息 :VxVM vxconfigrestore ERROR V-5-1-6012 There are two backups thathave the same diskgroup name with different diskgroup id :1047336696.19.xxx.veritas.com1049135264.31.xxx.veritas.com


74备 份 和 还 原 磁 盘 组 配 置还 原 磁 盘 组 配 置解 决 办 法 是 通 过 ID( 而 不 是 名 称 ) 来 指 定 要 执 行 还 原 的 磁 盘 组 。 备 份 文 件/etc/vx/cbr/bk/diskgroup.dgid/ dgid.dginfo 包 含 记 录 备 份 执 行 时 间 的 时 间戳 。下 面 是 来 自 一 个 备 份 文 件 的 示 例 , 其 中 显 示 了 时 间 戳 和 磁 盘 组 ID 信 息 :TIMESTAMPTue Apr 15 23:27:01 PDT 2003...DISK_GROUP_CONFIGURATIONGroup:mydgdgid: 1047336696.19.xxx.veritas.com...借 助 时 间 戳 信 息 确 定 哪 个 备 份 包 含 相 关 信 息 , 然 后 使 用 vxconfigrestore 命 令 指 定磁 盘 组 ID( 而 不 是 磁 盘 组 名 称 ) 来 还 原 配 置 。


8对 磁 盘 组 导 入 问 题 进 行 故障 排 除本 章 节 包 括 下 列 主 题 :■清 除 非 克 隆 磁 盘 的 udid_mismatch 标 志清 除 非 克 隆 磁 盘 的 udid_mismatch 标 志当 安 装 或 升 级 新 的 <strong>Veritas</strong> Volume Manager (VxVM) 软 件 包 或 阵 列 支 持 库 (ASL) 软件 包 后 , 对 ASL 进 行 更 改 可 能 会 导 致 在 非 克 隆 磁 盘 上 设 置 udid_mismatch 标 志 或clone_disk 标 志 。VxVM 使 用 这 些 标 志 指 示 LUN 的 硬 件 快 照 或 副 本 。如 果 磁 盘 是 非 克 隆 磁 盘 , 则 此 行 为 可 能 会 导 致 磁 盘 组 导 入 期 间 出 错 , 具 体 情 况 取 决于 导 入 标 志 。 在 导 入 磁 盘 组 时 ,VxVM 可 能 会 跳 过 克 隆 磁 盘 。 此 外 , 导 入 可 能 会 因磁 盘 组 同 时 包 含 克 隆 和 非 克 隆 磁 盘 而 失 败 。如 果 磁 盘 是 非 克 隆 磁 盘 , 您 必 须 手 动 清 除 该 磁 盘 上 的 udid_mismatch 标 志 , 然 后 才能 继 续 导 入 磁 盘 组 ,注 意 : 在 集 群 中 , 对 同 一 节 点 执 行 下 列 所 有 步 骤 。从 磁 盘 清 除 udid_mismatch 标 志1 检 索 显 示 udid_mismatch 标 志 或 clone_disk 标 志 的 已 刷 新 磁 盘 列 表 。 使 用 下列 方 法 之 一 :■ 运 行 以 下 命 令 :# vxdisk sc<strong>and</strong>isks# vxdisk list | egrep "udid_mismatch|clone_disk"


76对 磁 盘 组 导 入 问 题 进 行 故 障 排 除清 除 非 克 隆 磁 盘 的 udid_mismatch 标 志■ 或 者 , 运 行 下 面 一 条 命 令 :# vxdisk -o alldgs list | egrep "udid_mismatch|clone_disk"2 如 果 磁 盘 属 于 已 导 入 磁 盘 组 , 则 逐 出 该 磁 盘 组 。# vxdg deport dgname3 清 除 步 骤 1 中 标 识 的 所 有 非 克 隆 磁 盘 上 的 udid_mismatch 标 志 。# vxdisk updateudid diskname4 清 除 非 克 隆 磁 盘 上 的 clone 标 志 。# vxdisk set diskname clone=off5 导 入 磁 盘 组 ( 如 果 在 步 骤 2 中 将 其 逐 出 )# vxdg [-s] import dgname


9从 CDS 错 误 恢 复本 章 节 包 括 下 列 主 题 :■CDS 错 误 代 码 和 恢 复 操 作CDS 错 误 代 码 和 恢 复 操 作表 9-1 列 出 了 CDS 错 误 代 码 和 所 需 的 操 作 。表 9-1错 误 编 号329330331332错 误 代 码 和 所 需 操 作消 息不 能 将 非 CDS 磁 盘 组 与 CDS 磁 盘组 结 合磁 盘 组 用 于 不 同 的 平 台卷 具 有 与 CDS 不 兼 容 的 日 志用 于 CDS 的 许 可 证 过 期 或 不 可 用操 作将 非 CDS 磁 盘 组 更 改 为 CDS 磁 盘组 ( 或 以 相 反 顺 序 ), 然 后 重 试 结合 操 作 。将 磁 盘 组 导 入 到 正 确 平 台 上 。 它 无法 导 入 到 此 平 台 上 。要 获 得 兼 容 CDS 的 日 志 , 如 果 卷 当前 处 于 活 动 状 态 , 您 需 要 停 止 卷 ,然 后 启 动 卷 。 卷 成 功 启 动 之 后 , 重试 设 置 磁 盘 组 的 CDS 属 性 。从 <strong>Symantec</strong> 获 取 许 可 证 , 以 开 始使 用 CDS 磁 盘 组 。


78从 CDS 错 误 恢 复CDS 错 误 代 码 和 恢 复 操 作错 误 编 号333334335336337338339340341342343344消 息不 能 将 非 CDS 磁 盘 放 入 CDS 磁 盘组磁 盘 组 对 齐 值 与 CDS 不 兼 容子 磁 盘 长 度 违 反 磁 盘 组 对 齐 值子 磁 盘 偏 移 违 反 磁 盘 组 对 齐 值子 磁 盘 plex 偏 移 违 反 磁 盘 组 对 齐 值Plex 条 带 宽 度 与 磁 盘 组 对 齐 值 冲 突卷 或 日 志 长 度 与 磁 盘 组 对 齐 值 冲 突最 后 一 个 磁 盘 介 质 偏 移 值 与 磁 盘 组对 齐 值 冲 突磁 盘 组 中 的 设 备 节 点 太 多映 射 长 度 对 于 当 前 日 志 长 度 太 大卷 日 志 映 射 对 齐 值 与 磁 盘 组 对 齐 值冲 突磁 盘 设 备 无 法 用 作 CDS 磁 盘操 作执 行 以 下 操 作 之 一 :■■■向 其 他 非 CDS 磁 盘 组 的 另 一 磁盘 组 添 加 磁 盘 。将 磁 盘 重 新 初 始 化 为 CDS 磁盘 , 以 便 它 可 以 被 添 加 到 CDS磁 盘 组 。将 CDS 磁 盘 组 更 改 到 非 CDS 磁盘 组 , 然 后 添 加 磁 盘 。将 磁 盘 组 的 对 齐 值 更 改 为 8k, 然 后重 试 设 置 磁 盘 组 的 CDS 属 性 。确 保 子 磁 盘 长 度 值 是 8K 的 倍 数 。确 保 子 磁 盘 偏 移 值 是 8K 的 倍 数 。确 保 子 磁 盘 Plex 偏 移 值 是 8K 的 倍数 。确 保 Plex 条 带 宽 度 值 是 8K 的 倍数 。确 保 卷 的 长 度 值 是 8K 的 倍 数 。对 于 日 志 , 将dgalign_checking 属 性 值 设 置为 round。 这 可 以 确 保 日 志 长 度 静默 地 舍 入 至 有 效 值 。在 升 级 之 前 重 新 结 合 DM 记 录 。如 果 未 达 到 最 大 数 量 , 增 加 磁 盘 组中 允 许 的 设 备 节 点 数 。 否 则 , 您 可能 需 要 通 过 拆 分 磁 盘 组 从 磁 盘 组 中删 除 卷 。为 DRL/DCM 日 志 使 用 更 小 的 映 射长 度 , 或 者 增 加 日 志 长 度 并 重 试 。删 除 DRL/DCM 日 志 , 然 后 在 更 改磁 盘 组 对 齐 值 后 重 新 添 加 它 。


从 CDS 错 误 恢 复CDS 错 误 代 码 和 恢 复 操 作79错 误 编 号345346347348消 息磁 盘 组 包 含 无 法 在 此 平 台 上 导 入 的旧 式 RVGmax_autogrow 执 行 的 缓 存 对 象 的自 动 放 大 量 与 磁 盘 组 对 齐 值 冲 突 。该 磁 盘 组 的 用 户 事 务 被 禁 用磁 盘 正 在 使 用 中操 作在 创 建 RVG 的 平 台 上 导 入 磁 盘 组 。要 在 此 平 台 上 导 入 磁 盘 组 , 请 首 先在 创 建 平 台 上 删 除 RVG。确 保 缓 存 属 性 值 是 8K 的 倍 数 。重 试 命 令 , 因 为 同 时 它 由 执 行 的vxcdsconvert 命 令 临 时 禁 止 。与 技 术 支 持 联 系 。


80从 CDS 错 误 恢 复CDS 错 误 代 码 和 恢 复 操 作


10错 误 消 息本 章 节 包 括 下 列 主 题 :■■■关 于 错 误 消 息如 何 记 录 错 误 消 息消 息 类 型关 于 错 误 消 息<strong>Veritas</strong> Volume Manager (VxVM) 配 置 后 台 驻 留 程 序 (vxconfigd)、VxVM 内 核 驱动 程 序 vxio 和 各 种 VxVM 命 令 可 能 会 在 控 制 台 上 显 示 信 息 性 消 息 、 故 障 消 息 和 其他 错 误 消 息 。 这 些 消 息 可 能 涉 及 一 些 不 常 见 的 和 难 以 解 决 的 错 误 。注 意 : 这 里 描 述 的 某 些 错 误 消 息 可 能 不 适 用 于 您 的 系 统 。如 何 记 录 错 误 消 息您 可 能 会 发 现 参 考 VxVM 命 令 和 事 务 日 志 对 了 解 错 误 发 生 的 环 境 很 有 用 。请 参 见 第 61 页 的 “ 命 令 日 志 ”。VxVM 提 供 了 将 调 试 消 息 记 录 到 文 件 的 选 项 。 这 种 记 录 有 用 的 原 因 在 于 系 统 崩 溃 之前 的 任 何 消 息 输 出 都 可 以 从 日 志 文 件 找 到 ( 假 定 崩 溃 并 未 导 致 文 件 系 统 损 坏 )。如 果 启 用 , 则 默 认 调 试 日 志 文 件 为 /var/adm/vxconfigd.log。若 要 准 许 将 调 试 输 出 内 容 记 录 到 默 认 的 调 试 日 志 文 件 , 请 编 辑 vxconfigd 的 启 动 脚本 。vxconfigd 还 支 持 使 用 syslog 来 记 录 所 有 常 规 控 制 台 信 息 。 启 用 此 功 能 后 , 所 有控 制 台 输 出 都 通 过 syslog 接 口 定 向 。


82错 误 消 息如 何 记 录 错 误 消 息可 将 syslog 与 日 志 文 件 记 录 结 合 起 来 使 用 , 以 便 提 供 可 靠 的 日 志 记 录 ( 记 入 专 用日 志 文 件 ), 以 及 通 过 syslogd 进 行 的 分 布 式 日 志 记 录 。注 意 : 默 认 情 况 下 启 用 syslog 日 志 记 录 , 默 认 情 况 下 禁 用 调 试 消 息 记 录 。如 果 启 用 了 syslog 输 出 , 则 优 先 级 高 于 Debug 的 消 息 就 会 被 写 入/var/log/syslog/syslog.log 之 中 。请 参 见 第 82 页 的 “ 在 启 动 脚 本 中 配 置 日 志 记 录 ”。或 者 , 可 以 使 用 以 下 命 令 更 改 调 试 级 别 :# vxdctl debug level [pathname]有 10 种 可 能 的 调 试 日 志 记 录 级 别 : 级 别 值 从 0 到 9。1 级 提 供 的 详 细 信 息 最 少 ,9级 提 供 的 详 细 信 息 最 多 。0 级 关 闭 日 志 。 如 果 指 定 了 路 径 名 称 , 就 使 用 此 文 件 而 不是 默 认 的 调 试 日 志 文 件 来 记 录 调 试 输 出 。 如 果 使 用 vxdctl debug 命 令 , 则 新 的 调试 日 志 记 录 级 别 与 调 试 日 志 文 件 在 下 次 重 新 启 动 VxVM 配 置 后 台 驻 留 程 序 vxconfigd之 前 一 直 有 效 。请 参 见 vxdctl(1M) 手 册 页 。请 参 见 vxconfigd(1M) 手 册 页 。在 启 动 脚 本 中 配 置 日 志 记 录若 要 永 久 性 启 动 日 志 文 件 或 syslog 日 志 记 录 , 可 以 编 辑 启 动 VxVM 配 置 后 台 驻 留程 序 vxconfigd 的 /sbin/vxvm-sysboot 脚 本 。


错 误 消 息消 息 类 型83在 启 动 脚 本 中 配 置 日 志 记 录◆ 在 vxconfigd 中 注 释 掉 或 取 消 注 释 以 下 行 , 以 启 用 或 禁 用 相 应 功 能 :opts="$opts -x syslog"# use syslog for console messages#opts="$opts -x log"# messages to vxconfigd.log#opts="$opts -x logfile=/foo/bar" # specify an alternate log file#opts="$opts -x timestamp"# timestamp console messages# To turn on debugging console output, uncomment the following line.# The debug level can be set higher for more output. The highest# debug level is 9.#debug=1# enable debugging console output通 常 , 取 消 对 opts="$opts -x syslog" 字 符 串 的 注 释 , 这 样 vxconfigd 在 默认 情 况 下 使 用 syslog 日 志 记 录 。 在 行 首 插 入 # 字 符 将 禁 用 vxconfigd 的 syslog记 录 。默 认 情 况 下 , 引 导 时 使 用 -x syslog 选 项 启 动 vxconfigd。 这 会 将 vxconfigd控 制 台 信 息 重 定 向 到 syslog。 如 果 希 望 在 从 命 令 行 重 新 启 动 vxconfigd 时 保留 此 行 为 , 请 包 括 -x syslog 参 数 , 因 为 重 新 启 动 vxconfigd 时 不 保 留 它 以前 运 行 时 所 使 用 的 选 项 设 置 。 同 样 , 任 何 要 求 重 新 启 动 vxconfigd 的 <strong>Veritas</strong>Volume Manager 操 作 都 可 能 不 保 留 以 前 由 选 项 设 置 指 定 的 行 为 。消 息 类 型VxVM 具 有 容 错 能 力 , 不 需 要 系 统 管 理 员 干 预 就 可 以 解 决 大 多 数 问 题 。 如 果 配 置 后台 驻 留 程 序 vxconfigd 识 别 出 必 须 执 行 的 操 作 , 就 会 将 所 需 的 事 务 进 行 排 队 。VxVM提 供 系 统 配 置 的 原 子 更 改 : 即 要 么 事 务 处 理 全 部 完 成 , 要 么 系 统 保 留 在 似 乎 从 未 尝试 过 处 理 事 务 的 状 态 。 如 果 vxconfigd 无 法 识 别 和 解 决 系 统 问 题 , 系 统 管 理 员 就 需要 处 理 一 些 任 务 , 即 使 用 软 件 返 回 的 诊 断 信 息 来 解 决 问 题 。 以 下 各 节 介 绍 了 可 能 出现 的 错 误 消 息 编 号 和 错 误 消 息 类 型 , 并 提 供 了 常 见 错 误 列 表 、 问 题 的 可 能 起 因 的 详细 说 明 以 及 可 采 取 的 措 施 的 建 议 。错 误 消 息 一 般 具 有 以 下 格 式 :product component severity message_number message_text


84错 误 消 息消 息 类 型对 于 <strong>Veritas</strong> Volume Manager,product 设 置 为 VxVM。component 可 以 是 内 核 模块 或 驱 动 程 序 的 名 称 ( 如 vxdmp)、 配 置 后 台 驻 留 程 序 ( 如 vxconfigd) 或 命 令 ( 如vxassist)。按 照 对 系 统 影 响 程 度 由 重 到 轻 的 顺 序 , 将 错 误 消 息 划 分 为 以 下 几 种 严 重 程 度 类 型 :告 急告 急 是 一 种 严 重 事 件 , 因 为 此 类 事 件 会 在 系 统 正 常 操 作 时 停 止系 统 。 来 自 内 核 模 块 或 设 备 驱 动 程 序 的 告 急 信 息 表 明 , 硬 件 问题 或 软 件 不 一 致 问 题 非 常 严 重 , 以 致 系 统 无 法 继 续 运 行 。 操 作系 统 可 能 还 提 供 了 CPU 寄 存 器 内 容 转 储 及 堆 栈 跟 踪 , 以 帮 助 确定 告 急 的 原 因 。 下 面 是 此 类 信 息 的 示 例 :VxVM vxio PANIC V-5-0-239 Object associationdepth overflow致 命 错 误来 自 配 置 后 台 驻 留 程 序 ( 如 vxconfigd) 的 致 命 错 误 消 息 表 明VxVM 操 作 中 出 现 妨 碍 其 运 行 的 严 重 问 题 。 下 面 是 此 类 信 息 的示 例 :VxVM vxconfigd FATAL ERROR V-5-0-591 Disk groupbootdg: Inconsistency -- Not loaded into kernel错 误来 自 命 令 的 错 误 消 息 表 明 无 法 正 确 执 行 请 求 的 操 作 。 下 面 是 此类 信 息 的 示 例 :VxVM vxassist ERROR V-5-1-5150 Insufficientnumber of active snapshot mirrors insnapshot_volume.警 告来 自 内 核 的 警 告 消 息 表 明 非 关 键 操 作 失 败 , 原 因 可 能 是 某 些 资源 不 可 用 或 者 无 法 执 行 该 操 作 。 下 面 是 此 类 信 息 的 示 例 :VxVM vxio WARNING V-5-0-55 Cannot find devicenumber for boot_path通 知通 知 消 息 表 明 发 生 了 应 该 监 视 的 错 误 。 尽 管 可 能 需 要 以 后 采 取措 施 纠 正 错 误 , 但 不 必 马 上 关 闭 系 统 。 下 面 是 此 类 消 息 的 示 例 :VxVM vxio NOTICE V-5-0-252 read error on objectsubdisk of mirror plex in volume volume (startoffset, length length) corrected.信 息 性信 息 性 消 息 不 表 示 错 误 , 因 此 不 需 要 执 行 任 何 操 作 。唯 一 消 息 编 号 由 以 字 母 “V” 开 头 的 字 母 数 字 字 符 串 组 成 。 例 如 , 在 消 息 编 号V-5-1-3141 中 ,“V” 表 示 这 是 <strong>Veritas</strong> 产 品 错 误 消 息 , 第 一 个 数 字 字 段 (5) 表 示产 品 代 码 ( 这 里 是 VxVM), 第 二 个 字 段 (1) 表 示 有 关 产 品 组 件 的 信 息 , 第 三 个 字段 (3141) 是 消 息 索 引 。 错 误 消 息 的 正 文 在 唯 一 消 息 编 号 后 列 出 。


错 误 消 息消 息 类 型85消 息本 节 提 供 在 <strong>Veritas</strong> Volume Manager 操 作 过 程 中 可 能 遇 到 的 消 息 的 列 表 。 但 是 ,该 列 表 的 内 容 不 够 详 尽 , 并 且 第 二 个 字 段 中 可 能 包 含 不 同 于 这 里 显 示 的 命 令 、 驱 动程 序 或 模 块 的 名 称 。本 章 对 引 发 具 体 消 息 的 情 况 或 问 题 进 行 了 详 细 说 明 , 并 尽 可 能 提 供 了 有 助 于 找 出 并解 决 问 题 的 恢 复 过 程 。如 果 遇 到 产 品 错 误 消 息 , 请 记 录 消 息 文 本 前 的 唯 一 消 息 编 号 。 从 以 下 URL 中 搜 索 消息 编 号 以 查 找 有 关 该 消 息 的 信 息 :http://sort.symantec.com/通 过 电 话 或 访 问 <strong>Veritas</strong> 技 术 支 持 网 站 与 VERITAS 技 术 支 持 部 门 联 系 时 , 请 务 必 提供 相 关 的 消 息 编 号 。<strong>Veritas</strong> 技 术 支 持 部 门 将 使 用 此 消 息 编 号 迅 速 确 定 有 无 适 合 您的 TechNote 或 其 他 信 息 。


86错 误 消 息消 息 类 型


11<strong>Veritas</strong> Volume Replicator故 障 排 除本 章 节 包 括 下 列 主 题 :■■■RLINK 连 接 出 现 问 题 后 恢 复发 生 配 置 错 误 后 恢 复主 节 点 或 辅 助 节 点 上 的 恢 复RLINK 连 接 出 现 问 题 后 恢 复本 节 介 绍 连 接 RLINK 时 可 能 遇 到 的 错 误 。 要 解 决 RLINK 连 接 问 题 , 必 须 了 解 RLINK连 接 过 程 。连 接 主 节 点 RLINK 和 辅 助 节 点 RLINK 的 操 作 分 两 个 步 骤 。 第 一 步 是 挂 接 RLINK,通 过 执 行 vradmin startrep 命 令 来 完 成 。 第 二 步 是 连 接 RLINK, 通 过 主 节 点 主 机和 辅 助 节 点 主 机 上 的 内 核 来 完 成 。执 行 vradmin startrep 命 令 时 ,VVR 将 进 行 多 项 检 查 以 确 保 操 作 成 功 , 如 果 操 作成 功 , 该 命 令 会 将 RLINK 的 状 态 从 DETACHED/STALE 更 改 为 ENABLED/ACTIVE。然 后 , 该 命 令 会 返 回 成 功 信 息 。如 果 该 命 令 成 功 , 主 节 点 上 的 内 核 将 收 到 通 知 , 指 出 RLINK 已 启 用 并 开 始 向 请 求 进行 连 接 的 辅 助 节 点 发 送 消 息 。 在 正 常 情 况 下 , 辅 助 节 点 将 收 到 此 消 息 并 进 行 连 接 。然 后 ,RLINK 的 状 态 会 从 ENABLED/ACTIVE 更 改 为 CONNECT/ACTIVE。如 果 RLINK 的 状 态 在 短 时 间 内 没 有 更 改 为 CONNECT/ACTIVE, 则 可 能 发 生 了 阻 止连 接 的 问 题 。 本 节 将 介 绍 可 能 存 在 的 多 种 原 因 。 在 控 制 台 上 , 可 能 会 显 示 指 出 问 题的 错 误 消 息 。■ 如 果 控 制 台 上 显 示 以 下 错 误 :


88<strong>Veritas</strong> Volume Replicator 故 障 排 除RLINK 连 接 出 现 问 题 后 恢 复VxVM VVR vxrlink INFO V-5-1-5298 Unable to establish connectionwith remote host , retrying确 保 vradmind 后 台 驻 留 程 序 正 在 主 节 点 主 机 和 辅 助 节 点 主 机 上 运 行 ; 否 则 , 通过 执 行 以 下 命 令 启 动 vradmind 后 台 驻 留 程 序 :# /sbin/init.d/vras-vradmind.sh start对 于 共 享 磁 盘 组 中 的 RLINK, 确 保 对 日 志 所 有 者 启 用 了 RLINK 的 虚 拟 IP 地 址 。■如 果 没 有 很 明 显 的 错 误 消 息 说 明 , 请 在 主 节 点 主 机 和 辅 助 节 点 主 机 上 执 行 以 下命 令 :# vxprint -g diskgroup -l rlink_name在 输 出 信 息 中 检 查 以 下 项 :每 台 主 机 的 remote_host 与 另 一 台 主 机 的 local_host 是 否 相 同 。每 台 主 机 的 remote_dg 与 另 一 台 主 机 上 的 RVG 的 磁 盘 组 是 否 相 同 。每 台 主 机 的 remote_dg_dgid 与 另 一 台 主 机 上 的 RVG 的 dgid( 磁 盘 组 ID) 是否 相 同 , 如 vxprint -l diskgroup 命 令 的 输 出 所 示 。每 台 主 机 的 remote_rlink 与 另 一 台 主 机 上 对 应 的 RLINK 的 名 称 是 否 相 同 。每 台 主 机 的 remote_rlink_rid 与 另 一 台 主 机 上 对 应 的 RLINK 的 rid 是 否 相同 。确 保 网 络 按 照 预 期 运 行 。 网 络 问 题 可 能 会 影 响 VVR, 例 如 阻 止 RLINK 进 行 连 接或 降 低 性 能 。 问 题 可 能 包 括 高 延 迟 、 低 带 宽 、 高 冲 突 计 数 以 及 丢 失 过 多 的 数 据包 。■ 对 于 专 用 磁 盘 组 中 的 RLINK, 在 每 个 主 机 上 执 行 以 下 命 令 。对 于 共 享 磁 盘 组 中 的 RLINK, 在 主 节 点 和 辅 助 节 点 上 对 日 志 所 有 者 执 行 以 下 命令 :# ping remote_host应 该 不 会 丢 失 数 据 包 或 丢 失 的 数 据 包 很 少 。 为 确 保 网 络 可 以 传 输 大 型 数 据 包 ,请 在 每 个 主 机 上 对 专 用 磁 盘 组 中 的 RLINK 执 行 以 下 命 令 。对 于 共 享 磁 盘 组 中 的 RLINK, 在 主 节 点 和 辅 助 节 点 上 对 日 志 所 有 者 执 行 以 下 命令 :# ping remote_host 8192数 据 包 丢 失 情 况 应 该 与 早 期 的 ping 命 令 大 致 相 同 。■在 每 个 主 机 上 执 行 vxiod 命 令 , 以 确 保 存 在 活 动 的 I/O 后 台 驻 留 程 序 。 如 果 输出 是 0 volume I/O daemons running, 请 执 行 以 下 命 令 激 活 I/O 后 台 驻 留 程序 :# vxiod set 10


<strong>Veritas</strong> Volume Replicator 故 障 排 除RLINK 连 接 出 现 问 题 后 恢 复89■ VVR 使 用 公 知 端 口 与 其 他 主 机 建 立 通 信 。执 行 以 下 命 令 显 示 端 口 号 :# vxprint -g diskgroup -l rlink_name执 行 以 下 命 令 , 确 保 输 出 中 的 心 跳 端 口 号 与 vxprint 命 令 显 示 的 端 口 匹 配 :# vrport发 出 以 下 命 令 以 确 认 心 跳 端 口 是 否 已 开 放 :# netstat -an | grep port-number其 中 ,port-number 是 心 跳 服 务 器 正 在 使 用 的 端 口 号 , 与 vrport 命 令 显 示 的 端口 号 相 同 。输 出 与 以 下 内 容 类 似 :udp 0 0 *.port-number# netstat -an | grep tcp | grep 4145■ 检 查 主 站 点 和 辅 助 站 点 上 的 VVR 端 口 。运 行 vrport 实 用 程 序 , 验 证 两 端 的 端 口 是 否 相 同 。检 查 所 需 的 VVR 端 口 是 否 已 打 开 。 检 查 UDP 4145、TCP 4145、TCP 8199 和匿 名 端 口 。 输 入 以 下 命 令 :tcp 0 0 *.4145 *.* LISTEN# netstat -an | grep udp | grep 4145udp 0 0 *.4145 *.*# netstat -an | grep udp | grep 4145# netstat -an | grep tcp | grep 8199tcp 0 0 *.8199 *.* LISTEN执 行 telnet 测 试 以 检 查 打 开 的 端 口 。 例 如 , 要 确 定 端 口 4145 是 否 已 打 开 , 请输 入 以 下 内 容 :# telnet 4145■使 用 netstat 命 令 可 检 查 vradmind 后 台 驻 留 程 序 是 否 能 够 在 主 站 点 与 辅 助 站 点之 间 建 立 连 接 :# netstat -an | grep 8199 | grep ESTABLISHEDtcp 0 0 10.209.157.81.8199 10.209.157.87.52503 ESTABLISHEDtcp 0 0 10.209.157.81.52440 10.209.157.87.8199 ESTABLISHEDtcp 0 0 10.209.157.81.59501 10.209.157.87.8199 ESTABLISHED


90<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复发 生 配 置 错 误 后 恢 复当 主 节 点 RVG 和 辅 助 节 点 RVG 的 配 置 不 同 时 , 就 会 发 生 配 置 错 误 。 主 节 点 RVG中 的 每 个 数 据 卷 必 须 在 辅 助 节 点 RVG 中 有 对 应 的 数 据 卷 , 且 大 小 必 须 完 全 相 同 ;否 则 , 复 制 将 不 会 继 续 。 如 果 卷 集 与 RDS 相 关 联 , 则 主 节 点 和 辅 助 节 点 上 的 卷 集配 置 也 必 须 匹 配 。可 通 过 两 种 方 式 检 测 配 置 错 误 :■■RLINK 挂 接 期 间 的 错 误首 次 挂 接 RLINK 时 , 将 会 检 查 辅 助 节 点 是 否 存 在 配 置 错 误 。 如 果 发 现 任 何 错误 ,attach 命 令 就 会 失 败 并 输 出 错 误 消 息 指 出 问 题 。 通 过 更 正 配 置 错 误 并 重 试挂 接 即 可 修 复 该 问 题 。影 响 主 节 点 或 辅 助 节 点 上 配 置 的 更 改 可 能 导 致 辅 助 节 点 进 入 已 设 置secondary_config_err 标 志 的 PAUSE 状 态 。 通 过 更 正 配 置 错 误 并 恢 复 RLINK即 可 修 复 该 问 题 。在 RLINK 挂 接 期 间 ,VVR 会 检 查 数 据 卷 的 配 置 中 是 否 存 在 错 误 。 如 果 RDS 具 有 与RVG 关 联 的 卷 集 ,VVR 还 会 检 查 卷 集 的 配 置 中 是 否 存 在 错 误 。RLINK 挂 接 期 间 的 数 据 卷 错 误挂 接 RLINK 时 ,VVR 会 检 查 对 于 与 主 节 点 RVG 相 关 联 的 每 个 数 据 卷 , 辅 助 节 点RVG 是 否 有 一 个 大 小 相 同 、 映 射 到 主 节 点 上 其 对 应 项 的 相 关 联 数 据 卷 。 以 下 示 例说 明 了 可 能 会 发 生 各 种 问 题 的 挂 接 尝 试 , 以 及 如 何 修 复 这 些 问 题 。 在 执 行 attach操 作 之 前 , 主 节 点 具 有 以 下 配 置 :TY Name Assoc KSTATE LENGTH STATErv hr_rvg - DISABLED - EMPTYrl rlk_london_hr_rvg hr_rvg DETACHED - STALEv hr_dv01 hr_rvg ENABLED 12800 ACTIVEpl hr_dv01-01 hr_dv01 ENABLED 12800 ACTIVEsd disk01-05 hr_dv01-01 ENABLED 12800 -v hr_dv02 hr_rvg ENABLED 12800 ACTIVEpl hr_dv02-01 hr_dv02 ENABLED 12880 ACTIVE


<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复91sd disk01-06 hr_dv02-01 ENABLED 12880v hr_dv03 hr_rvg ENABLED 12880 ACTIVEpl hr_dv03-01 hr_dv03 ENABLED 12880 ACTIVEsd disk01-07 hr_dv03-01 ENABLED 12880 -v hr_srl hr_rvg ENABLED 12880 ACTIVEpl hr_srl-01 hr_srl ENABLED 12880 ACTIVEsd disk01-08 hr_srl-01 ENABLED 12880 0 -辅 助 节 点 具 有 以 下 配 置 :TY Name Assoc KSTATE LENGTH STATErv hr_rvg - ENABLED - - ACTIVErl rlk_seattle_hr_rvg hr_rvg ENABLED - - ACTIVEv hr_dv01 hr_rvg ENABLED 12700 - ACTIVEpl hr_dv01-01 hr_dv01 ENABLED 13005 - ACTIVEsd disk01-17 hr_dv01-01 ENABLED 13005 0 -v hr_dv2 hr_rvg ENABLED 12880 - ACTIVEpl hr_dv02-01 vol2 ENABLED 13005 - ACTIVEsd disk01-18 hr_dv02-01 ENABLED 13005 0 -v hr_srl hr_rvg ENABLED 12880 - ACTIVEpl hr_srl-01 hr_srl ENABLED 13005 - ACTIVEsd disk01-19 hr_srl-01 ENABLED 13005 0 -请 注 意 , 辅 助 节 点 上 卷 hr_dv01 的 大 小 比 较 小 ,hr_dv2 的 名 称 有 误 ( 必 须 是hr_dv02) 并 且 缺 少 hr_dv03。 尝 试 使 用 attach 命 令 将 主 节 点 RLINK 挂 接 到 此 辅助 节 点 失 败 。


92<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复# vxrlink -g hrdg -f att rlk_london_hr_rvg将 显 示 以 下 消 息 :VxVM VVR vxrlink INFO V-5-1-3614 Secondary data volumes detectedwith rvg hr_rvg as parent:VxVM VVR vxrlink ERROR V-5-1-0 Size of secondary datavol hr_dv01(len=12700) does not match size of primary (len=12800)VxVM VVR vxrlink ERROR V-5-1-3504 primary datavol hr_dv02 is notmapped on secondary, yetVxVM VVR vxrlink ERROR V-5-1-3504 primary datavol hr_dv03 is notmapped on secondary, yet要 修 复 该 问 题 , 请 在 辅 助 节 点 上 发 出 以 下 命 令 :1 调 整 数 据 卷 hr_dv01 的 大 小 :# vradmin -g hrdg resizevol hr_rvg hr_dv01 128002 将 数 据 卷 hr_dv2 重 命 名 为 hr_dv02:# vxedit -g hrdg rename hr_dv2 hr_dv023 关 联 与 主 节 点 数 据 卷 hr_dv03 大 小 相 同 的 新 卷 hr_dv03。# vxassist -g hrdg make hr_dv03 12800# vxvol -g hrdg assoc hr_rvg hr_dv03或 者 , 通 过 更 改 主 节 点 以 匹 配 辅 助 节 点 或 结 合 上 述 两 种 方 法 都 可 以 修 复 该 问 题 。 当主 节 点 和 辅 助 节 点 匹 配 时 , 重 试 挂 接 。在 主 节 点 上 :# vxrlink -g hrdg -f att rlk_london_hr_rvgVxVM VVR vxrlink INFO V-5-1-3614 Secondary data volumes detectedwith rvg hr_rvg as parent:VxVM VVR vxrlink INFO V-5-1-0 vol1: len=12800 primary_datavol=hr_dv01VxVM VVR vxrlink INFO V-5-1-0 vol1: len=12800 primary_datavol=hr_dv02VxVM VVR vxrlink INFO V-5-1-0 vol1: len=12800 primary_datavol=hr_dv03RLINK 挂 接 期 间 的 卷 集 错 误如 果 卷 集 与 RDS 相 关 联 , 则 主 节 点 上 的 卷 集 名 称 必 须 与 辅 助 节 点 上 的 卷 集 名 称 相同 , 且 卷 集 的 组 件 卷 必 须 具 有 相 同 的 配 置 。挂 接 RLINK 时 ,VVR 会 检 查 对 于 与 主 节 点 RVG 相 关 联 的 每 个 卷 集 , 辅 助 节 点 RVG是 否 有 一 个 名 称 相 同 的 相 关 联 卷 集 。 此 外 ,VVR 还 会 检 查 主 节 点 上 的 卷 集 是 否 与 辅


<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复93助 节 点 上 的 卷 集 具 有 相 同 的 组 件 卷 ( 名 称 、 长 度 和 索 引 相 同 )。 ( 如 果 主 节 点 上 的组 件 卷 和 辅 助 节 点 上 的 组 件 卷 已 如 独 立 卷 映 射 , 则 其 卷 名 可 以 不 同 。) 如 果 辅 助 节点 上 不 存 在 任 何 组 件 卷 或 组 件 卷 名 称 、 长 度 或 索 引 不 匹 配 , 则 RLINK 挂 接 命 令 会 失败 并 返 回 相 应 的 错 误 消 息 。请 参 见 第 95 页 的 “ 修 改 RVG 期 间 出 现 的 卷 集 配 置 错 误 ”。如 果 辅 助 节 点 上 不 存 在 卷 集 , 但 辅 助 节 点 上 存 在 所 有 组 件 卷 , 并 且 都 有 正 确 的 名 称和 长 度 , 则 VVR 会 在 辅 助 节 点 上 创 建 卷 集 并 将 其 关 联 到 RDS。 这 不 会 导 致 配 置 错误 。修 改 RVG 期 间 出 现 错 误在 初 次 设 置 和 挂 接 辅 助 节 点 RLINK 之 后 , 如 果 不 正 确 的 修 改 ( 如 添 加 、 重 定 大 小 和重 命 名 卷 ) 导 致 主 节 点 上 和 辅 助 节 点 上 的 卷 不 匹 配 , 则 会 产 生 配 置 错 误 。 如 果 RVG有 相 关 联 的 卷 集 , 则 对 卷 集 的 修 改 也 会 导 致 配 置 错 误 。 这 些 修 改 包 括 不 正 确 地 添加 、 删 除 或 重 命 名 相 关 联 卷 集 的 组 件 卷 ; 在 主 节 点 上 和 辅 助 节 点 上 添 加 具 有 不 同 索引 的 组 件 卷 ; 或 重 命 名 相 关 联 的 卷 集 。当 修 改 RVG 导 致 配 置 错 误 时 , 受 影 响 的 RLINK 会 进 入 已 设 置secondary_config_err 标 志 的 PAUSED 状 态 。 这 会 禁 止 复 制 到 辅 助 节 点 , 直 到问 题 更 正 为 止 。请 在 任 一 节 点 上 运 行 vxrlink verify rlink 命 令 , 检 查 是 否 发 生 此 错 误 。 配 置 错误 得 到 更 正 时 , 可 以 恢 复 受 影 响 的 RLINK。在 修 改 RVG 期 间 出 现 缺 少 数 据 卷 错 误如 果 向 主 节 点 RVG 添 加 数 据 卷 , 但 辅 助 节 点 没 有 对 应 的 数 据 卷 , 则 RLINK 状 态 将更 改 为 PAUSED 并 且 设 置 secondary_config_err 标 志 。 执 行 vxrlink verify命 令 将 生 成 以 下 内 容 :在 主 节 点 上 :# vxrlink -g hrdg verify rlk_london_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUS STATErlk_london_hr_rvg london seattle ERROR PAUSEERROR: hr_dv04 does not exist on secondary (london)在 辅 助 节 点 上 :# vxrlink -g hrdg verify rlk_seattle_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUSSTATErlk_seattle_hr_rvg seattle london ERRORPAUSEERROR: hr_dv04 does not exist on secondary (local host)


94<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复要 更 正 此 问 题 , 请 在 辅 助 节 点 上 创 建 并 关 联 hr_dv04, 或 者 使 vol04 与 主 节 点 分离 , 然 后 恢 复 辅 助 节 点 RLINK。 要 恢 复 辅 助 节 点 RLINK, 请 使 用 vradminresumerep rvg_name 命 令 。如 果 主 节 点 上 的 hr_dv04 包 含 有 效 数 据 , 请 将 其 内 容 复 制 到 辅 助 节 点 上 的 hr_dv04中 , 然 后 再 将 该 卷 与 辅 助 节 点 RVG 关 联 。在 修 改 RVG 期 间 出 现 数 据 卷 不 匹 配 错 误如 果 增 加 了 主 节 点 数 据 卷 大 小 , 但 未 增 加 辅 助 节 点 数 据 卷 大 小 , 则 会 发 生 配 置 错误 。在 主 节 点 上 :# vxassist growby hr_dv04 100# vxrlink -g hrdg verify rlk_london_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUS STATErlk_london_hr_rvg london seattle ERROR PAUSEERROR: hr_dv04 too small (12800). Primary is 12900在 辅 助 节 点 上 :# vxrlink -g hrdg verify rlk_seattle_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUS STATErlk_seattle_hr_rvg seattle london ERROR PAUSEERROR: hr_dv04 too small (12800). Primary is 12900要 更 正 此 问 题 , 请 增 加 辅 助 节 点 数 据 卷 的 大 小 , 或 者 减 小 主 节 点 数 据 卷 的 大 小 :# vradmin -g hrdg resizevol hr_rvg hr_dv04 12900重 定 数 据 卷 大 小 后 , 通 过 在 RDS 中 的 任 意 主 机 上 执 行 以 下 命 令 来 恢 复 辅 助 节 点RLINK:# vradmin -g hrdg resumerep hr_rvg在 修 改 RVG 期 间 出 现 数 据 卷 名 称 不 匹 配 错 误如 果 在 主 节 点 上 重 命 名 了 某 数 据 卷 , 但 未 在 辅 助 节 点 上 执 行 该 操 作 , 则 会 发 生 配 置错 误 且 RLINK 将 断 开 连 接 。 请 使 用 vxprint -lP 命 令 查 看 RLINK 标 志 。 如 果 设置 了 secondary_config_err 标 志 , 请 使 用 以 下 命 令 之 一 来 确 定 是 否 存 在 数 据 卷 名称 不 匹 配 错 误 。在 主 节 点 上 :# vxrlink -g hrdg verify rlk_london_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUS STATE


<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复95rlk_london_hr_rvg london seattle ERROR PAUSEERROR: hr_dv04 on secondary has wrong primary_datavol name (hr_dv04,should be hr_dv05)在 辅 助 节 点 上 :# vxrlink -g hrdg verify rlk_seattle_hr_rvgRLINK REMOTE HOST LOCAL_HOST STATUS STATErlk_seattle_hr_rvg seattle london ERROR PAUSEERROR: hr_dv04 on secondary has wrong primary_datavol name (hr_dv04,should be hr_dv05)要 修 复 此 错 误 , 请 执 行 以 下 操 作 之 一 :■■重 命 名 主 节 点 数 据 卷 或 辅 助 节 点 数 据 卷 , 然 后 使 用 vradmin resumerep rvg_name命 令 恢 复 RLINK。或将 辅 助 节 点 数 据 卷 上 的 primary_datavol 字 段 设 置 为 引 用 主 节 点 数 据 卷 的 新 名称 ( 如 下 所 示 ), 然 后 使 用 vradmin resumerep rvg_name 命 令 恢 复 RLINK。在 辅 助 节 点 上 :# vxedit -g hrdg set primary_datavol=hr_dv05 hr_dv04其 中 hr_dv05 是 主 节 点 上 的 新 名 称修 改 RVG 期 间 出 现 的 卷 集 配 置 错 误如 果 卷 集 与 RDS 相 关 联 , 则 辅 助 节 点 上 卷 集 的 名 称 只 有 与 主 节 点 上 卷 集 的 名 称 相同 , 才 能 进 行 复 制 。 此 外 , 辅 助 节 点 上 的 卷 集 必 须 与 主 节 点 上 的 卷 集 具 有 相 同 的 组件 卷 ( 名 称 、 长 度 和 索 引 相 同 )。如 果 在 主 节 点 上 调 整 了 组 件 卷 的 大 小 , 但 没 有 在 辅 助 节 点 上 进 行 调 整 , 则 会 导 致 数据 卷 不 匹 配 的 错 误 。 请 调 整 该 卷 的 大 小 并 恢 复 复 制 。请 参 见 第 94 页 的 “ 在 修 改 RVG 期 间 出 现 数 据 卷 不 匹 配 错 误 ”。首 次 挂 接 RLINK 时 , 将 会 检 查 辅 助 节 点 是 否 存 在 配 置 错 误 。 如 果 发 现 任 何 错 误 ,vradmin startrep 命 令 就 会 失 败 并 输 出 错 误 消 息 指 出 问 题 。 请 更 正 配 置 错 误 , 然后 重 试 该 命 令 。修 改 卷 集 或 其 组 件 卷 时 , 也 可 能 发 生 配 置 错 误 。 请 在 任 一 节 点 上 运 行 vxrlinkverify rlink 命 令 , 检 查 是 否 发 生 此 错 误 。 更 正 配 置 错 误 , 然 后 恢 复 RLINK。卷 集 名 称 不 匹 配 错 误如 果 主 节 点 和 辅 助 节 点 上 的 卷 集 名 称 不 同 , 将 显 示 以 下 错 误 :


96<strong>Veritas</strong> Volume Replicator 故 障 排 除发 生 配 置 错 误 后 恢 复VSet name vset_name of secondary datavol vol_name does not matchVSet name vset_name of primary datavol vol_name要 更 正 此 问 题 , 请 使 用 以 下 命 令 在 主 节 点 或 者 辅 助 节 点 上 重 命 名 卷 集 :# vxedit -g diskgroup rename vset_name new_vset_name卷 索 引 不 匹 配 错 误如 果 主 节 点 卷 集 和 辅 助 节 点 卷 集 上 的 组 件 卷 的 索 引 不 同 , 将 显 示 以 下 错 误 :VSet index (index_name) of secondary datavol vol_name does notmatch VSet index (index_name) of primary datavol vol_name要 更 正 此 问 题 , 请 在 辅 助 节 点 上 执 行 以 下 步 骤 :1 使 用 以 下 命 令 从 卷 集 中 分 离 每 个 卷 :# vxvset -g diskgroup rmvol vset_name compvol_name删 除 最 后 一 个 卷 时 , 卷 集 也 会 被 删 除 。2 使 用 以 下 命 令 创 建 卷 集 :# vxvset -g diskgroup -o index make vset_name \compvol_name index3 将 其 余 每 个 卷 关 联 到 卷 集 , 并 使 用 以 下 命 令 在 主 节 点 上 指 定 相 应 卷 的 索 引 :# vxvset -g diskgroup -o index addvol vset_name \compvol_name index组 件 卷 不 匹 配 错 误如 果 仅 将 数 据 卷 从 主 节 点 RVG 上 的 卷 集 中 删 除 , 或 者 仅 将 数 据 卷 添 加 到 辅 助 节 点RVG 上 的 卷 集 中 , 将 显 示 以 下 错 误 :Secondary datavol vol_name is associated to VSet vol_namewhereas primary datavol is not associated to any Vset类 似 地 , 如 果 仅 将 数 据 卷 从 辅 助 节 点 RVG 上 的 卷 集 中 删 除 , 或 者 仅 将 数 据 卷 添 加到 主 节 点 RVG 上 的 卷 集 中 , 将 显 示 以 下 错 误 :Primary datavol vol_name is associated to VSet whereas secondarydatavol vol_name is not associated to any Vset要 更 正 此 问 题 , 请 在 辅 助 节 点 卷 集 或 主 节 点 卷 集 中 添 加 或 删 除 数 据 卷 。 主 节 点 和 辅助 节 点 上 的 卷 集 应 该 有 相 同 的 组 件 卷 。


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复97要 向 卷 集 中 添 加 数 据 卷 , 请 执 行 以 下 操 作 之 一 :■ 向 RVG 中 的 卷 集 添 加 数 据 卷 :# vradmin -tovset vset_name addvol rvg_name vol_name■ 从 RVG 中 的 卷 集 删 除 数 据 卷 :# vradmin -fromvset vset_name delvol rvg_name vol_name主 节 点 或 辅 助 节 点 上 的 恢 复本 节 介 绍 如 何 在 发 生 各 类 灾 难 ( 例 如 主 节 点 主 机 崩 溃 或 者 主 节 点 或 辅 助 节 点 数 据 卷中 发 生 错 误 ) 后 恢 复 。关 于 从 主 节 点 主 机 崩 溃 中 恢 复当 主 节 点 主 机 在 发 生 故 障 后 恢 复 时 ,VVR 会 自 动 恢 复 RVG 配 置 。 当 主 节 点 恢 复 时 ,VVR 会 恢 复 RVG 中 的 主 节 点 SRL 和 所 有 卷 。SRL 和 数 据 卷 最 近 活 动 的 相 关 信 息 会在 SRL 头 中 进 行 维 护 。VVR 使 用 该 信 息 可 加 快 重 新 启 动 时 自 动 执 行 的 恢 复 的 速 度 。主 节 点 数 据 卷 发 生 错 误 后 恢 复如 果 对 主 节 点 数 据 卷 的 写 入 失 败 , 将 会 分 离 该 数 据 卷 。 RVG 继 续 像 之 前 一 样 运 行 ,提 供 对 RVG 中 其 他 卷 的 访 问 。 向 故 障 卷 写 入 会 返 回 错 误 , 但 不 会 记 录 在 SRL 中 。RLINK 不 受 数 据 卷 故 障 影 响 。 如 果 SRL 在 卷 发 生 错 误 时 非 空 , 这 些 更 新 会 继 续 从SRL 流 向 辅 助 节 点 RLINK。 已 由 应 用 程 序 完 成 但 未 写 入 卷 的 所 有 向 故 障 卷 的 写 入 都保 存 在 SRL 中 。 这 些 写 入 在 SRL 中 标 记 为 挂 起 , 当 该 卷 恢 复 后 将 重 放 到 该 卷 中 。如 果 从 备 份 恢 复 该 卷 并 重 新 启 动 , 这 些 写 入 将 被 丢 弃 。如 果 数 据 卷 的 故 障 是 永 久 性 的 , 例 如 硬 件 损 坏 , 则 必 须 从 备 份 恢 复 。 发 生 此 故 障 后恢 复 包 括 两 部 分 操 作 :■■从 备 份 还 原 主 节 点 数 据 卷重 新 同 步 所 有 辅 助 节 点 RLINK如 果 RVG 包 含 数 据 库 , 则 出 现 故 障 的 数 据 卷 的 恢 复 必 须 与 数 据 库 的 恢 复 要 求 一 致 。数 据 库 恢 复 顺 序 的 详 细 信 息 确 定 同 步 辅 助 节 点 RLINK 必 须 执 行 的 操 作 。下 面 给 出 了 恢 复 过 程 的 详 细 示 例 :■ 请 参 见 第 98 页 的 “ 示 例 - 使 用 分 离 的 RLINK 进 行 恢 复 ”。■ 请 参 见 第 98 页 的 “ 示 例 - 以 最 小 修 复 工 作 量 进 行 恢 复 ”。■ 请 参 见 第 99 页 的 “ 示 例 - 通 过 迁 移 主 节 点 进 行 恢 复 ”。


98<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复如 果 数 据 卷 故 障 是 由 于 临 时 中 断 ( 例 如 电 缆 断 开 连 接 ) 所 致 , 并 且 您 确 定 不 存 在 永久 性 的 硬 件 损 坏 , 则 可 以 在 不 将 数 据 卷 与 RVG 分 离 的 情 况 下 启 动 数 据 卷 。 SRL 中暂 停 的 写 入 将 重 放 到 该 数 据 卷 。请 参 见 第 99 页 的 “ 示 例 - 发 生 临 时 I/O 错 误 后 恢 复 ”。示 例 - 使 用 分 离 的 RLINK 进 行 恢 复在 此 示 例 中 , 在 主 节 点 上 开 始 恢 复 故 障 之 前 , 将 分 离 所 有 RLINK。 完 成 故 障 恢 复( 包 括 所 有 数 据 库 恢 复 过 程 ) 后 , 必 须 使 用 主 节 点 存 储 检 查 点 同 步 所 有 RLINK。请 在 主 节 点 上 执 行 这 些 步 骤 。 在 此 示 例 中 , 主 节 点 主 机 是 seattle。故 障 后 恢 复1 分 离 所 有 RLINK# vxrlink -g hrdg det rlk_london_hr_rvg2 修 复 数 据 卷 。如 果 可 以 通 过 修 复 数 据 卷 的 基 础 子 磁 盘 来 修 复 数 据 卷 , 则 不 需 要 从 RVG 中 分离 数 据 卷 。 如 果 通 过 分 离 发 生 故 障 的 卷 并 在 其 位 置 关 联 一 个 新 卷 来 解 决 问 题 ,则 必 须 在 停 止 RVG 时 进 行 分 离 和 关 联 。3 确 保 在 重 新 启 动 RVG 前 启 动 数 据 卷 。# vxvol -g hrdg start hr_dv01# vxrvg -g hrdg start hr_rvg4 还 原 数 据 库 。5 使 用 块 级 别 备 份 和 检 查 点 同 步 所 有 RLINK。示 例 - 以 最 小 修 复 工 作 量 进 行 恢 复本 示 例 采 取 最 少 的 操 作 修 复 数 据 卷 错 误 , 同 时 保 持 所 有 RLINK 处 于 挂 接 状 态 。 在本 示 例 中 , 从 备 份 还 原 出 现 故 障 的 卷 数 据 以 及 数 据 库 恢 复 是 通 过 活 动 RLINK 实 现的 。 由 于 会 复 制 主 节 点 中 的 全 部 更 改 , 因 此 复 制 完 更 改 后 , 所 有 辅 助 节 点 都 必 须 与主 节 点 保 持 一 致 。 此 方 法 可 能 不 总 是 实 用 , 因 为 可 能 需 要 复 制 大 量 的 数 据 。 此 外 ,还 必 须 在 要 支 持 的 每 个 目 标 数 据 库 中 对 修 复 的 数 据 卷 进 行 仔 细 测 试 。请 在 主 节 点 上 执 行 这 些 步 骤 。 在 此 示 例 中 , 主 节 点 主 机 是 seattle。


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复99故 障 后 恢 复1 停 止 RVG。# vxrvg -g hrdg stop hr_rvg2 将 出 现 故 障 的 数 据 卷 与 RVG 分 离 。3 修 复 该 数 据 卷 或 使 用 新 卷 。如 果 可 以 通 过 修 复 数 据 卷 的 基 础 子 磁 盘 来 修 复 数 据 卷 , 则 不 需 要 从 RVG 中 分离 数 据 卷 。 如 果 通 过 分 离 发 生 故 障 的 卷 并 在 其 位 置 关 联 一 个 新 卷 来 解 决 问 题 ,则 必 须 在 停 止 RVG 时 进 行 分 离 和 关 联 。4 将 卷 与 RVG 关 联 。5 确 保 在 重 新 启 动 RVG 前 启 动 数 据 卷 。 如 果 该 数 据 卷 未 启 动 , 则 启 动 数 据 卷 :# vxvol -g hrdg start hr_dv016 启 动 RVG:# vxrvg -g hrdg start hr_rvg7 还 原 数 据 库 。示 例 - 通 过 迁 移 主 节 点 进 行 恢 复一 种 替 代 性 的 恢 复 方 法 是 : 将 主 节 点 角 色 转 移 到 辅 助 节 点 主 机 。接 管 后 , 具 有 故 障 数 据 卷 的 原 始 主 节 点 将 不 会 变 为 acting_secondary, 直 到 恢 复 或分 离 故 障 数 据 卷 为 止 。示 例 - 发 生 临 时 I/O 错 误 后 恢 复如 果 数 据 卷 上 的 I/O 错 误 是 临 时 错 误 , 并 且 您 确 定 所 有 现 有 数 据 都 保 持 不 变 , 则 可以 启 动 数 据 卷 , 而 不 必 将 其 与 RVG 分 离 。 例 如 , 如 果 SCSI 电 缆 断 开 连 接 或 存 储 器断 电 , 在 这 种 情 况 下 , 请 执 行 下 列 步 骤 。发 生 临 时 I/O 错 误 后 恢 复1 修 复 临 时 故 障 。2 启 动 数 据 卷 :# vxvol -g hrdg start hr_dv01SRL 中 的 所 有 未 完 成 写 入 均 被 写 入 到 数 据 卷 。


100<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复主 节 点 SRL 卷 错 误 清 除 和 重 新 启 动如 果 访 问 主 节 点 SRL 时 出 错 , 将 分 离 该 SRL 以 及 RLINK。 主 节 点 和 辅 助 节 点 RLINK的 状 态 会 更 改 为 STALE。 RVG 状 态 不 会 更 改 , 但 是 RVG 会 被 置 于 PASSTHRU 模式 , 这 使 得 在 修 复 该 错 误 之 前 可 以 继 续 更 新 主 节 点 卷 。请 参 见 第 100 页 的 “ 关 于 RVG PASSTHRU 模 式 ”。必 须 手 动 修 复 SRL, 然 后 将 其 与 RVG 关 联 。 在 修 复 SRL 时 , 不 能 尝 试 向 RLINK发 送 数 据 。 在 替 换 SRL 后 , 必 须 完 全 同 步 所 有 RLINK。 挂 接 RLINK 并 对 辅 助 节 点执 行 完 全 同 步 。在 主 节 点 (seattle) 上 :发 生 主 节 点 SRL 错 误 后 清 除1 从 RVG 中 分 离 SRL。# vxvol -g hrdg dis hr_srl2 修 复 或 替 换 SRL 卷 。3 确 保 先 启 动 已 修 复 的 SRL, 然 后 再 将 其 与 RVG 关 联 。 如 果 修 复 后 的 SRL 未 启动 , 请 启 动 它 :# vxvol -g hrdg start hr_srl4 将 新 的 SRL 与 RVG 关 联 。 关 联 新 SRL 后 ,RVG PASSTHRU 模 式 将 不 再 显 示在 vxprint -lV 命 令 的 输 出 中 。# vxvol -g hrdg aslog hr_rvg hr_srl5 完 全 同 步 辅 助 节 点 。关 于 RVG PASSTHRU 模 式通 常 , 写 入 关 联 RVG 的 数 据 卷 中 的 内 容 先 转 至 RVG 的 SRL 上 , 然 后 再 转 至 RLINK和 数 据 卷 。 如 果 由 于 访 问 错 误 导 致 主 节 点 SRL 曾 经 被 分 离 , 则 主 节 点 RVG 将 被 置于 PASSTHRU 模 式 。 在 PASSTHRU 模 式 下 , 写 入 数 据 卷 的 内 容 将 绕 过 SRL, 直接 传 递 到 底 层 数 据 卷 。 RLINK 不 接 收 写 入 内 容 。 在 RVG 上 使 用 vxprint -l 可 查看 是 否 设 置 了 passthru 标 志 。 关 联 新 的 SRL 将 清 除 PASSTHRU 模 式 , 且 辅 助 节点 RVGs 必 须 保 持 同 步 。


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复101重 新 启 动 时 主 节 点 SRL 卷 出 错如 果 在 重 新 启 动 期 间 主 节 点 SRL 出 错 , 那 么 可 能 是 包 含 SRL 的 磁 盘 或 阵 列 仍 未 联机 所 致 。 因 此 ,VVR 不 会 恢 复 RVG, 而 是 将 其 置 于 PASSTHRU 模 式 。 当 SRL 变得 可 用 时 , 可 执 行 下 列 命 令 来 恢 复 RVG 和 RLINK:# vxrvg -g diskgroup recover rvg_name# vxrlink -g diskgroup recover rlink_name在 发 生 错 误 并 成 功 恢 复 RVG 之 后 , 如 果 从 RVG 中 分 离 卷 , 则 可 能 会 看 到 以 下 消息 :Because there could be outst<strong>and</strong>ing writes in the SRL, the data volumebeing dissociated should be considered out-of-date <strong>and</strong> inconsistent可 以 忽 略 此 消 息 。如 果 SRL 永 久 丢 失 , 请 创 建 一 个 新 的 SRL。请 参 见 第 102 页 的 “ 在 SRL 头 出 错 后 恢 复 ”。在 这 种 情 况 下 , 有 可 能 在 旧 SRL 上 已 成 功 完 成 且 为 应 用 程 序 所 确 认 的 写 入 仍 未 刷 新到 数 据 卷 , 并 且 现 已 丢 失 。 因 此 , 在 继 续 操 作 之 前 必 须 从 备 份 中 还 原 数 据 卷 。 因 为这 会 导 致 完 全 重 写 数 据 卷 , 建 议 在 还 原 操 作 完 成 之 后 分 离 RLINK 并 使 其 同 步 。主 节 点 SRL 卷 溢 出 恢 复由 于 主 节 点 SRL 的 大 小 是 有 限 的 , 对 任 何 RLINK 的 更 新 活 动 的 延 迟 停 止 可 能 会 超出 日 志 维 护 所 有 必 需 的 更 新 历 史 记 录 以 使 RLINK 最 新 的 能 力 。 发 生 这 种 情 况 时 , 有问 题 的 RLINK 会 被 标 记 为 STALE 并 且 需 要 手 动 恢 复 , 然 后 复 制 才 能 继 续 。 只 能 使用 自 动 同 步 或 块 级 别 备 份 以 及 存 储 检 查 点 使 STALE RLINK 保 持 最 新 。 其 他 RLINK、RVG 和 SRL 卷 都 会 依 然 处 于 运 行 中 。可 以 设 置 SRL 溢 出 保 护 以 防 止 SRL 溢 出 , 这 是 默 认 设 置 。 不 会 允 许 RLINK 成 为STALE 状 态 , 将 启 动 dcm 日 志 记 录 。 当 稍 后 通 信 链 路 未 过 载 时 , 可 以 使 用 vradminresync rvg 命 令 以 递 增 方 式 重 新 同 步 RLINK。主 节 点 SRL 头 错 误 清 理 和 恢 复主 节 点 上 发 生 的 SRL 头 故 障 是 一 个 严 重 错 误 。 所 有 RLINK 都 会 丢 失 , 必 须 使 用 主节 点 存 储 检 查 点 进 行 恢 复 。 由 于 数 据 卷 错 误 的 相 关 信 息 保 存 在 SRL 头 中 , 因 此 在 发生 此 错 误 的 任 何 情 况 下 , 都 无 法 保 证 数 据 卷 的 状 态 是 正 确 的 。 为 此 , 建 议 您 为 SRL设 置 镜 像 。如 果 SRL 头 错 误 在 正 常 操 作 期 间 发 生 , 而 且 您 在 重 新 启 动 之 前 注 意 到 该 错 误 , 则 可以 确 定 同 样 ( 同 步 ) 出 现 故 障 的 所 有 数 据 卷 的 状 态 都 将 为 DETACHED。 如 果 在vxprint 命 令 显 示 将 处 于 DETACHED 状 态 的 卷 之 前 重 新 启 动 系 统 , 可 能 会 丢 失 所


102<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复有 出 现 故 障 的 数 据 卷 的 状 态 。 这 两 种 情 况 都 涉 及 多 个 错 误 , 因 此 不 太 可 能 发 生 , 但了 解 使 用 此 类 错 误 可 以 质 疑 主 节 点 数 据 卷 的 状 态 是 很 重 要 的 。发 生 主 节 点 SRL 头 错 误 时 , 将 会 继 续 执 行 到 RVG 的 写 入 ; 但 是 , 所 有 RLINK 都 将置 于 STALE 状 态 。 RVG 在 PASSTHRU 模 式 下 运 行 。在 SRL 头 出 错 后 恢 复如 果 要 在 SRL 头 出 错 后 恢 复 , 则 需 要 从 RVG 中 分 离 SRL、 修 复 SRL 以 及 完 全 同 步所 有 RLINK。在 SRL 头 出 错 后 恢 复1 停 止 RVG。# vxrvg -g hrdg stop hr_rvg2 从 RVG 中 分 离 SRL。# vxvol -g hrdg dis hr_srl3 修 复 或 还 原 SRL。 即 使 可 通 过 修 复 基 础 子 磁 盘 来 解 决 该 问 题 , 也 必 须 对 SRL进 行 分 离 和 重 新 关 联 以 便 初 始 化 SRL 头 。4 确 保 SRL 已 启 动 , 然 后 重 新 关 联 SRL:# vxvol -g hrdg start hr_srl# vxvol -g hrdg aslog hr_rvg hr_srl5 启 动 RVG:# vxrvg -g hrdg start hr_rvg6 如 果 需 要 , 请 从 备 份 中 还 原 数 据 卷 。 同 步 所 有 RLINK。辅 助 节 点 数 据 卷 错 误 清 除 和 恢 复如 果 在 访 问 辅 助 节 点 数 据 卷 期 间 发 生 I/O 错 误 , 则 该 数 据 卷 将 自 动 从 RVG 分 离 且RLINK 断 开 连 接 。 主 节 点 到 辅 助 节 点 的 后 续 连 接 尝 试 将 失 败 , 并 显 示 一 条 消 息 , 说明 辅 助 节 点 数 据 卷 已 停 止 。 主 节 点 不 受 影 响 , 写 入 会 继 续 记 录 到 SRL 中 。 当 辅 助节 点 数 据 卷 的 错 误 得 以 修 复 且 该 数 据 卷 启 动 后 ,RLINK 将 自 动 重 新 连 接 。如 果 没 有 合 适 的 主 节 点 或 辅 助 节 点 存 储 检 查 点 , 将 同 时 在 主 节 点 和 辅 助 节 点 上 分 离RLINK, 然 后 再 同 步 RLINK。


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复103使 用 辅 助 节 点 存 储 检 查 点 恢 复本 节 介 绍 如 何 使 用 辅 助 节 点 存 储 检 查 点 实 现 辅 助 节 点 数 据 卷 错 误 恢 复 。在 辅 助 节 点 (london) 上 :1 修 复 出 现 故 障 的 数 据 卷 。 如 果 可 以 通 过 修 复 基 础 子 磁 盘 修 复 该 问 题 , 则 不 必 分离 数 据 卷 。2 确 保 启 动 该 数 据 卷 :# vxvol -g hrdg start hr_dv013 将 辅 助 节 点 存 储 检 查 点 备 份 中 的 数 据 还 原 到 所 有 卷 中 。 如 果 所 有 卷 都 已 从 备 份还 原 , 则 辅 助 节 点 将 在 同 步 过 程 中 保 持 一 致 。 通 过 执 行 以 下 命 令 还 原 RLINK:# vxrlink -g hrdg -c sec_chkpt restore rlk_seattle_hr_rvg使 用 主 节 点 存 储 检 查 点 清 除在 辅 助 节 点 (london) 上 :1 如 上 所 示 , 修 复 出 现 故 障 的 数 据 卷 。 确 保 先 启 动 数 据 卷 , 再 继 续 :# vxvol -g hrdg start hr_dv012 分 离 RLINK 以 启 用 对 辅 助 节 点 数 据 卷 的 写 入 :# vxrlink -g hrdg det rlk_seattle_hr_rvg3 将 主 节 点 存 储 检 查 点 备 份 中 的 数 据 还 原 到 所 有 数 据 卷 中 。 与 从 辅 助 节 点 存 储 检查 点 还 原 不 同 , 主 节 点 存 储 检 查 点 数 据 必 须 加 载 到 所 有 辅 助 节 点 数 据 卷 , 而 不仅 仅 是 出 现 故 障 的 卷 。 如 果 可 用 主 节 点 存 储 检 查 点 尚 不 存 在 , 请 创 建 一 个 新 的存 储 检 查 点 。4 重 新 挂 接 RLINK。# vxrlink -g hrdg att rlk_seattle_hr_rvg在 主 节 点 (seattle) 上 :先 分 离 RLINK, 然 后 再 使 用 以 下 命 令 从 主 节 点 存 储 检 查 点 重 新 挂 接 :# vxrlink -g hrdg det rlk_london_hr_rvg# vxrlink -g hrdg -c primary_checkpoint att rlk_london_hr_rvg


104<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复辅 助 节 点 SRL 卷 错 误 清 除 和 恢 复只 有 在 对 RLINK 进 行 原 子 恢 复 的 过 程 中 且 IBC 处 于 活 动 状 态 时 , 才 能 使 用 辅 助 节点 SRL。 如 果 在 辅 助 节 点 SRL 的 恢 复 过 程 中 发 生 I/O 错 误 , 则 恢 复 将 失 败 ,SRL卷 会 被 自 动 分 离 , 且 RLINK 被 强 制 设 置 为 暂 停 状 态 。 需 要 手 动 干 预 来 修 复 此 物 理问 题 、 重 新 挂 接 SRL, 然 后 恢 复 RLINK。 恢 复 完 成 时 , 将 会 自 动 重 试 对 RVG 的 恢复 , 如 果 成 功 , 则 更 新 活 动 可 继 续 。 唯 一 的 问 题 是 如 果 在 修 复 完 成 之 前 主 节 点 SRL溢 出 , 则 需 要 完 全 同 步 。如 果 在 SRL 的 数 据 部 分 发 生 错 误 , 则 RLINK 会 被 强 制 设 置 为 PAUSE 状 态 , 同 时 设置 secondary_paused 标 志 。 不 会 分 离 SRL。如 果 在 SRL 头 中 发 生 错 误 , 则 辅 助 节 点 RVG 会 被 强 制 设 置 为 FAIL 状 态 , 并 将 分 离SRL。在 辅 助 节 点 (london) 上 :1 分 离 SRL, 对 其 进 行 修 复 , 然 后 重 新 关 联 。 即 使 可 以 通 过 修 复 基 础 子 磁 盘 来 修复 此 问 题 , 分 离 和 重 新 关 联 依 然 是 必 需 的 , 原 因 是 此 序 列 操 作 将 初 始 化 SRL头 。# vxvol -g hrdg dis hr_srl修 复 或 替 换 SRL。 确 保 先 启 动 SRL, 然 后 再 关 联 :# vxvol -g hrdg start hr_srl# vxvol -g hrdg aslog hr_rvg hr_srl2 运 行 RLINK 恢 复 操 作 以 清 除 secondary_log_err 标 志 。# vxrlink -g hrdg resume rlk_seattle_hr_rvg辅 助 节 点 SRL 头 错 误 清 除 和 恢 复辅 助 节 点 上 的 SRL 头 故 障 会 将 辅 助 节 点 RVG 置 于 失 败 状 态 , 且 将 主 节 点 和 辅 助 节点 上 的 RLINK 状 态 设 置 为 PAUSE 状 态 。 由 于 数 据 卷 错 误 的 相 关 信 息 保 存 在 SRL 头中 , 因 此 不 能 保 证 所 有 情 况 下 数 据 卷 状 态 都 是 正 确 的 。 如 果 在 正 常 操 作 期 间 发 生 辅助 节 点 SRL 头 故 障 , 且 您 在 重 新 启 动 之 前 注 意 到 该 故 障 , 则 同 时 发 生 故 障 的 所 有 数据 卷 的 状 态 都 将 为 DETACHED。 如 果 在 vxprint 命 令 显 示 将 处 于 DETACHED 状态 的 卷 之 前 重 新 启 动 系 统 , 可 能 会 丢 失 所 有 出 现 故 障 的 数 据 卷 的 状 态 。 这 两 种 情 况都 涉 及 多 个 错 误 , 因 此 不 太 可 能 发 生 , 但 了 解 使 用 此 类 错 误 可 以 质 疑 辅 助 节 点 数 据卷 的 状 态 是 很 重 要 的 。


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复105清 除 和 恢 复 SRL 头 故 障1 分 离 SRL 卷 。# vxvol -g hrdg dis hr_srl2 修 复 SRL 卷 。 即 使 可 通 过 修 复 基 础 子 磁 盘 来 解 决 该 问 题 , 也 必 须 对 SRL 卷 进行 分 离 和 重 新 关 联 以 便 初 始 化 SRL 头 。3 启 动 SRL 卷 。 然 后 , 重 新 关 联 该 卷 。# vxvol -g hrdg start hr_srl# vxvol -g hrdg aslog hr_rvg hr_srl


106<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复4 启 动 RVG。# vxrvg -g hrdg start hr_rvg5 如 果 对 数 据 卷 的 完 整 性 没 有 疑 问 , 则 可 恢 复 RLINK。# vxrlink -g hrdg resume rlk_seattle_hr_rvg或如 果 怀 疑 数 据 卷 的 完 整 性 , 且 辅 助 节 点 存 储 检 查 点 备 份 可 用 , 请 从 辅 助 节 点 存储 检 查 点 还 原 。# vxrlink -g hrdg det rlk_seattle_hr_rvg# vxrlink -g hrdg -f att rlk_seattle_hr_rvg# vxrlink -g hrdg -w pause rlk_seattle_hr_rvg将 辅 助 节 点 存 储 检 查 点 备 份 数 据 还 原 到 数 据 卷 。# vxrlink -g hrdg -c secondary_checkpoint restore \rlk_seattle_hr_rvg或如 果 怀 疑 数 据 卷 的 完 整 性 且 没 有 辅 助 节 点 存 储 检 查 点 可 用 , 请 使 用 块 级 别 备 份和 主 节 点 存 储 检 查 点 同 步 辅 助 节 点 。此 外 , 还 可 以 使 用 自 动 同 步 。# vxrlink -g hrdg det rlk_seattle_hr_rvg在 辅 助 节 点 上 , 将 主 节 点 存 储 检 查 点 备 份 数 据 还 原 到 数 据 卷 。# vxrlink -g hrdg -f att rlk_seattle_hr_rvg在 主 节 点 (seattle) 上 :# vxrlink -g hrdg -c primary_checkpoint att \rlk_london_hr_rvg重 新 启 动 时 发 生 辅 助 节 点 SRL 头 错 误如 果 在 重 新 启 动 后 辅 助 节 点 SRL 发 生 错 误 , 将 无 法 修 复 , 即 使 SRL 随 后 可 用 也 一样 。 忽 略 以 下 消 息 :


<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复107VxVM VVR vxrvg ERROR V-5-1-0 RVG rvg_name cannot be recoveredbecause SRL is not accessible. Try recovering the RVG after theSRL becomes available using vxrecover -s comm<strong>and</strong>重 置 SRL 卷1 分 离 SRL:# vxvol -g hrdg -f dis srl忽 略 以 下 消 息 :VxVM vxvol WARNING V-5-1-0 WARNING: Rvg rvgname has not beenrecovered because the SRL is not available. The data volumes maybe out-of-date <strong>and</strong> inconsistentVxVM vxvol WARNING V-5-1-0 The data volumes in the rvg rvgnamecannot be recovered because the SRL is being dissociated.Restore the data volumes from backup before starting the applications2 创 建 一 个 新 SRL 卷 new_srl 并 继 续 , 如 下 所 示 :# vxvol -g hrdg aslog rvg_name new_srl# vxrlink -g hrdg recover rlink_name# vxrlink -g hrdg -f att rlink_name# vxrvg -g hrdg start rvg_name如 果 复 制 由 于 收 到 IBC 而 被 冻 结 , 则 SRL 中 的 数 据 将 丢 失 , 但 不 会 指 出 发 生 此问 题 。 要 查 看 是 否 存 在 该 问 题 , 请 检 查 /var/adm/syslog/syslog.log 文 件中 的 消 息 , 例 如 :WARNING: VxVM VVR vxio V-5-0-259 Replication frozen for rlink如 果 这 是 RLINK 的 最 后 一 条 消 息 , 即 如 果 没 有 后 续 消 息 说 明 复 制 已 取 消 冻 结 ,则 必 须 完 全 重 新 同 步 主 节 点 RLINK。


108<strong>Veritas</strong> Volume Replicator 故 障 排 除主 节 点 或 辅 助 节 点 上 的 恢 复


部 分3Dynamic Multi-Pathing 故 障排 除■12. Dynamic Multi-Pathing 故 障 排 除


110


12Dynamic Multi-Pathing 故障 排 除本 章 节 包 括 下 列 主 题 :■降 级 阵 列 支 持降 级 阵 列 支 持单 个 depot VRTSaslapm 提 供 阵 列 支 持 , 包 括 阵 列 支 持 库 (ASL) 和 阵 列 策 略 模 块(APM)。<strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong> <strong>Availability</strong> Solutions 的 每 个 主 要版 本 均 包 括 支 持 的 VRTSaslapm depot, 它 是 在 产 品 安 装 过 程 中 安 装 的 。 在 主 要 版 本之 间 ,<strong>Symantec</strong> 可 能 会 通 过 VRTSaslapm VRTSaslapm depot 的 更 新 来 提 供 额 外 的阵 列 支 持 。如 果 更 新 的 VRTSaslapm depot 有 问 题 ,<strong>Symantec</strong> 会 建 议 您 降 级 到 ASL/APM depot的 早 期 版 本 。 您 只 能 还 原 到 已 安 装 的 <strong>Veritas</strong> <strong>Storage</strong> Foundation <strong>and</strong> <strong>High</strong><strong>Availability</strong> Solutions 版 本 所 支 持 的 depot。 为 了 在 系 统 联 机 时 执 行 降 级 , 请 不 要删 除 安 装 的 depot, 而 是 在 新 depot 的 基 础 上 安 装 该 depot 的 早 期 版 本 。 此 方 法 可 防止 安 装 VRTSaslapm depot 的 多 个 实 例 。使 用 以 下 方 法 可 以 使 VRTSaslapm depot 降 级 。在 联 机 时 使 ASL/APM depot 降 级◆ 在 以 下 命 令 中 指 定 VRTSaslapm depot 的 早 期 版 本 :# swinstall -x allow_downdate=true -s source_path VRTSaslapm其 中 source_path 是 depot 的 位 置 。


112Dynamic Multi-Pathing 故 障 排 除降 级 阵 列 支 持


部 分4<strong>Veritas</strong> <strong>Storage</strong> FoundationCluster File System <strong>High</strong><strong>Availability</strong> 故 障 排 除■13. <strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排除


114


13<strong>Veritas</strong> <strong>Storage</strong> FoundationCluster File System <strong>High</strong><strong>Availability</strong> 故 障 排 除本 章 节 包 括 下 列 主 题 :■■■■关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排除CFS 故 障 排 除防 护 配 置 故 障 排 除对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排 除关 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System<strong>High</strong> <strong>Availability</strong> 故 障 排 除CFS 故 障 排 除本 章 中 的 信 息 可 帮 助 您 诊 断 可 能 出 现 的 设 置 或 配 置 问 题 。 对 于 组 件 产 品 中 出 现 的 问题 , 可 能 需 要 参 考 相 应 的 技 术 文 档 予 以 解 决 。I/O 防 护 的 故 障 排 除 信 息 也 适 用 于 <strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System<strong>High</strong> <strong>Availability</strong> (SFCFSHA) 的 故 障 排 除 。请 参 见 第 146 页 的 “I/O 防 护 故 障 排 除 ”。本 节 讨 论 CFS 问 题 故 障 排 除 。


116<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除CFS 故 障 排 除root 用 户 的 路 径 中 的 顺 序 不 正 确如 果 root 用 户 的 路 径 中 的 顺 序 不 正 确 , 则 在 更 改 集 群 文 件 系 统 或 RAC集 群 中 的 主 节 点 时 , 系 统 可 能 会 挂 起 。如 果 root 用 户 的 路 径 在 /usr/lib 条 目 之 前 包 含 一 个 指 向 集 群 文 件 系 统(CFS) 文 件 系 统 的 条 目 , 则 在 尝 试 执 行 以 下 任 务 之 一 时 系 统 可 能 会 挂 起 :■■■更 改 CFS 文 件 系 统 的 主 节 点在 主 节 点 上 卸 载 CFS 文 件 系 统在 主 节 点 上 停 止 集 群 或 服 务 组此 配 置 问 题 主 要 出 现 在 在 共 享 CFS 文 件 系 统 上 安 装 了 Oracle 二 进 制 文 件 的 RAC 环境 中 。下 面 是 一 个 可 能 导 致 系 统 挂 起 的 示 例 :LD_LIBRARY_PATH=/opt/SUNWspro/lib:\/app/oracle/orahome/lib:/usr/lib:/usr/ccs/lib在 以 上 示 例 中 , /app/oracle 是 一 个 CFS 文 件 系 统 , 如 果 用 户 尝 试 更 改 该 文 件 系 统的 主 节 点 , 系 统 将 挂 起 。 用 户 仍 然 能 够 对 系 统 执 行 ping 和 telnet 命 令 , 但 类 似 ls这 样 的 简 单 命 令 不 会 响 应 。 更 改 主 节 点 过 程 中 需 要 执 行 的 初 始 步 骤 之 一 是 在 集 群 范围 内 冻 结 文 件 系 统 , 随 后 立 即 执 行 fsck 命 令 以 重 放 意 向 日 志 。由 于 路 径 中 的 初 始 条 目 指 向 冻 结 的 文 件 系 统 本 身 , 因 此 fsck 命 令 将 进 入死 锁 状 态 。 实 际 上 , 依 赖 路 径 的 所 有 命 令 ( 包 括 ls) 从 现 在 开 始 都 会 挂起 。建 议 用 来 纠 正 此 问 题 的 过 程 如 下 所 示 : 将 任 何 用 户 ( 尤 其 是 root 用 户 ) 的 路 径 中 指 向 CFS 文 件 系 统 的 所 有 条 目 移 动 到 列 表 末 尾 , 位 于 /usr/lib 条 目 之 后 。这 样 , 上 面 的 示 例 将 更 改 为 以 下 形 式 :LD_LIBRARY_PATH=/opt/SUNWspro/lib:\/usr/lib:/usr/ccs/lib:/app/oracle/orahome/lib非 root 用 户 运 行 CFS 命 令 时 CFS 命 令 可 能 会 挂 起 (2403263)非 root 用 户 运 行 CFS 命 令 时 CFS 命 令 可 能 会 挂 起 。Workaround


<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除防 护 配 置 故 障 排 除117解 决 此 问 题◆在 非 root 用 户 会 话 中 运 行 任 何 CFS 命 令 之 前 , 使 用 halogin 命 令 保 存 身 份 验证 信 息 。当 您 运 行 halogin 命 令 时 ,VCS 会 将 已 加 密 的 身 份 验 证 信 息 存 储 在 用 户 主 目 录中 。防 护 配 置 故 障 排 除以 下 信 息 介 绍 了 防 护 环 境 下 的 网 络 分 裂 。请 参 见 《<strong>Veritas</strong> Cluster Server 管 理 指 南 》。已 有 网 络 分 裂 ( 裂 脑 ) 的 示 例图 13-1 显 示 了 一 个 双 节 点 集 群 , 在 该 集 群 中 被 切 断 的 集 群 互 联 形 成 了 潜 在 的 裂 脑 情况 。图 13-1 已 有 的 网 络 分 裂 ( 裂 脑 )1 - 互 连 失 败 导 致 两 个 节 点 进 行 争 夺 。2 - 节 点 0 成 功 逐 出1 磁 盘 1 的 键 B。3 - 节 点 0 成 功逐 出 磁 2 盘 2 的 键B。4 - 节 点 0成 功 逐 出 3 磁 盘 3的 键 B。节 点 0 节 点 1协 调 器 磁 盘2(B 部 分 ), 节 点 1未 能 逐 出 磁 盘 1 的 键A。 重 新 读 取3(B 部 分 ), 节 点 1未 能 逐 出 磁 盘 2 的 键A。 重 新 读 取 键 。4(B 部 分 ), 节 点 1未 能 逐 出 磁 盘 3 的 键 。5 - 节 点 0 继 续执 行 恢 复 。最 后 - 节 点 1发 生 混 乱 并 重 新 启 动 。由 于 防 护 模 块 在 各 系 统 上 的 运 行 方 式 相 同 , 因 此 两 个 节 点 假 设 其 他 节 点 已 发 生 故 障并 执 行 防 护 操 作 , 以 确 保 逐 出 其 他 节 点 。 各 节 点 上 的 VCS GAB 模 块 可 确 定 因 心 跳丢 失 发 生 的 对 等 节 点 故 障 , 并 将 成 员 集 更 改 传 递 给 防 护 模 块 。每 一 端 都 会 争 夺 协 调 器 磁 盘 的 控 制 权 。 由 于 只 有 已 注 册 节 点 能 逐 出 另 一 节 点 的 注册 , 因 此 只 有 一 端 能 够 成 功 地 在 各 磁 盘 上 完 成 命 令 。


118<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除防 护 配 置 故 障 排 除从 协 调 器 磁 盘 主 节 点 成 功 逐 出 对 等 节 点 的 一 端 获 胜 。 然 后 , 获 胜 端 的 防 护 模 块 将 成员 集 更 改 传 递 给 VCS 及 其 他 已 注 册 防 护 模 块 的 高 级 别 软 件 包 , 并 允 许 VCS 调 用 恢复 操 作 。 失 败 端 则 强 制 调 用 内 核 混 乱 并 重 新 引 导 。从 已 有 网 络 分 裂 ( 裂 脑 ) 中 恢 复防 护 模 块 vxfen 防 止 在 发 生 网 络 分 裂 和 接 下 来 的 混 乱 后 启 动 节 点 , 然 后 重 新 引 导 节点 。示 例 场 景 I图 13-2 的 场 景 可 能 会 产 生 与 其 中 一 个 节 点 被 关 闭 用 于 维 护 的 双 节 点 集 群 相 似 的 症状 。 在 中 断 期 间 , 专 用 互 连 电 缆 是 断 开 的 。图 13-2示 例 场 景 I1 - 网 络 互 连被 切 断 。节 点 0 在 对 协 调 器的 争 夺 中 获 胜 。3 - 节 点 0 将 键 注 册 到所 有 协 调 器磁 盘 。节 点 0 节 点 1协 调 器 磁 盘2- 节 点 1发 生 混 乱 并 重 新 启 动最 后 , 节 点 1 会 启 动并 发 现为 非 成 员 注 册 了 键 。 显 示错 误 消 息 并 退 出 。在 示 例 场 景 I 中 , 会 出 现 下 列 情 况 :■ 节 点 0 在 网 络 故 障 后 对 协 调 器 的 争 夺 中 获 胜 。■ 节 点 1 发 生 混 乱 并 重 新 启 动 。■节 点 0 将 键 注 册 到 协 调 器 磁 盘 。 节 点 1 启 动 时 , 识 别 节 点 0 键 , 但 无 法 识 别 当前 GAB 成 员 集 中 的 节 点 0。 它 可 以 判 断 可 能 预 先 存 在 的 裂 脑 , 随 后 使 vxfen 模块 在 控 制 台 上 打 印 出 一 条 错 误 消 息 。vxfen 模 块 将 阻 止 防 护 启 动 , 随 后 阻 止 VCS联 机 。建 议 的 解 决 方 案 : 关 闭 节 点 1, 重 新 连 接 电 缆 , 并 重 新 启 动 节 点 1。示 例 场 景 II与 示 例 场 景 I 类 似 , 如 果 在 双 节 点 集 群 中 断 开 专 用 互 连 电 缆 , 则 节 点 1 被 防 护 在 集群 外 , 该 节 点 将 发 生 混 乱 并 重 新 启 动 。 如 果 在 专 用 互 连 电 缆 修 复 之 前 , 节 点 1 重 新加 入 集 群 , 则 节 点 0 重 新 启 动 并 远 程 登 录 ( 或 只 是 重 新 启 动 )。 在 专 用 网 络 修 复前 , 无 法 将 节 点 写 入 数 据 磁 盘 。 原 因 是 无 法 形 成 GAB 成 员 集 , 因 此 也 无 法 形 成 集群 。


<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排 除119与 示 例 场 景 I 类 似 , 如 果 在 双 节 点 集 群 中 断 开 专 用 互 连 电 缆 , 则 节 点 1 被 防 护 在 集群 外 , 该 节 点 将 发 生 混 乱 并 重 新 启 动 。 在 专 用 网 络 修 复 前 , 无 法 将 节 点 写 入 数 据 磁盘 。 原 因 是 无 法 形 成 GAB 成 员 集 , 因 此 也 无 法 形 成 集 群 。建 议 的 解 决 方 案 : 关 闭 两 个 节 点 , 重 新 连 接 电 缆 , 并 重 新 启 动 节 点 。示 例 场 景 III与 示 例 场 景 II 类 似 , 如 果 在 双 节 点 集 群 中 断 开 专 用 互 连 电 缆 , 则 节 点 1 被 防 护 在 集群 外 , 该 节 点 将 发 生 混 乱 并 重 新 启 动 。 如 果 在 专 用 互 联 电 缆 修 复 前 , 节 点 1 重 新 加入 集 群 , 但 节 点 0 因 硬 件 故 障 出 现 混 乱 且 无 法 恢 复 , 则 节 点 1 无 法 重 新 加 入 。建 议 的 解 决 方 案 : 关 闭 节 点 1, 重 新 连 接 电 缆 , 并 重 新 启 动 节 点 。 然 后 必 须 从 协 调器 磁 盘 中 清 除 节 点 0 的 注 册 。修 复 场 景 III1 在 节 点 1 上 , 键 入 以 下 命 令 :# /opt/VRTSvcs/vxfen/bin/vxfenclearpre2 重 新 启 动 节 点 。3 运 行 :# gabconfig -cx对 SFHA Solutions 集 群 中 的 Cluster Volume Manager进 行 故 障 排 除本 节 讨 论 就 CVM 问 题 进 行 的 故 障 排 除 。将 节 点 添 加 到 SFHA Solutions 集 群 后 ,CVM 组 仍 处 于 脱 机 状 态向 集 群 中 添 加 节 点 后 ,CVM 组 处 于 脱 机 状 态 的 可 能 原 因 如 下 :■ cssd 资 源 在 cvm 组 中 配 置 为 关 键 资 源 。■ cvm 组 中 配 置 为 关 键 资 源 的 其 他 资 源 处 于 脱 机 状 态 。


120<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排 除在 将 cssd 配 置 为 关 键 资 源 时 解 决 问 题1 以 root 用 户 身 份 登 录 现 有 集 群 中 的 其 中 一 个 节 点 。2 在 cvm 组 中 将 cssd 资 源 配 置 为 非 关 键 资 源 :# haconf -makerw# hares -modify cssd Critical 0# haconf -dump -makero在 组 中 的 其 他 资 源 脱 机 时 解 决 问 题1 以 root 用 户 身 份 登 录 现 有 集 群 中 的 其 中 一 个 节 点 。2 使 资 源 联 机 :# hares -online resource_name -sys system_name3 验 证 资 源 的 状 态 :# hastatus -resource resource_name4 如 果 资 源 脱 机 , 请 将 其 配 置 为 非 关 键 资 源 :# haconf -makerw# hares -modify resource_name Critical 0# haconf -dump -makero在 SFHA Solutions 集 群 中 无 法 导 入 共 享 磁 盘 组比 如 显 示 类 似 以 下 内 容 的 消 息 时 :vxvm:vxconfigd:ERROR:vold_pgr_register(/dev/vx/rdmp/disk_name):local_node_id


<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排 除121上 述 输 出 表 明 CVM 运 行 正 常 , 并 且 系 统 system01 被 用 作 CVM 主 节 点 。 如 果 CVM运 行 正 常 , 则 当 CVM 无 法 从 vxfen 驱 动 程 序 检 索 本 地 系 统 的 节 点 ID 时 , 会 显 示 上述 输 出 。 未 配 置 端 口 b 时 , 通 常 发 生 这 种 情 况 。验 证 是 否 配 置 了 vxfen 驱 动 程 序◆ 使 用 以 下 命 令 检 查 GAB 端 口 :# gabconfig -a本 地 系 统 上 必 须 存 在 端 口 b。在 SFHA Solutions 集 群 中 导 入 共 享 磁 盘 组 出 错导 入 共 享 磁 盘 组 时 , 可 能 出 现 以 下 消 息 :VxVM vxdg ERROR V-5-1-587 Disk group disk group name: importfailed: No valid disk found containing disk group可 能 需 要 删 除 已 写 入 到 磁 盘 的 密 钥 。有 关 删 除 写 入 到 磁 盘 的 密 钥 的 信 息 :无 法 在 SFHA Solutions 集 群 中 启 动 CVM如 果 您 无 法 启 动 CVM, 请 检 查 /etc/llthosts 和 main.cf 文 件 中 节 点 ID 的 一 致性 。可 能 需 要 删 除 已 写 入 到 磁 盘 的 密 钥 。有 关 删 除 写 入 到 磁 盘 的 密 钥 的 信 息 :即 使 CVMCluster 在 SFHA Solutions 集 群 中 处 于 联 机 状 态 ,CVMVolDg也 不 联 机当 CVMCluster 资 源 处 于 联 机 状 态 时 , 会 自 动 导 入 已 设 置 auto-import 标 志 的 所 有共 享 磁 盘 组 。 如 果 由 于 某 种 原 因 磁 盘 组 导 入 失 败 , 则 CVMVolDg 资 源 会 出 现 故 障 。清 理 CVMVolDg 类 型 的 资 源 并 使 之 脱 机 不 能 解 决 此 问 题 。解 决 资 源 问 题1 解 决 导 致 共 享 磁 盘 组 导 入 失 败 的 问 题 。2 使 包 含 CVMVolDg 资 源 类 型 的 cvm 组 和 包 含 CVMCluster 资 源 类 型 的 服 务 组脱 机 。3 使 包 含 CVMCluster 资 源 的 cvm 组 联 机 。4 使 包 含 CVMVolDg 资 源 的 cvm 组 联 机 。


122<strong>Veritas</strong> <strong>Storage</strong> Foundation Cluster File System <strong>High</strong> <strong>Availability</strong> 故 障 排 除对 SFHA Solutions 集 群 中 的 Cluster Volume Manager 进 行 故 障 排 除


部 分5<strong>Veritas</strong> Cluster Server 故 障排 除■14. VCS 的 故 障 排 除 与 恢 复


124


14VCS 的 故 障 排 除 与 恢 复本 章 节 包 括 下 列 主 题 :■■■■■■■■■■■■■VCS 消 息 日 志 记 录VCS 引 擎 故 障 排 除Low Latency Transport (LLT) 故 障 排 除Group Membership Services/Atomic Broadcast (GAB) 故 障 排 除VCS 启 动 故 障 排 除智 能 监 视 框 架 (IMF) 故 障 排 除疑 难 解 答 服 务 组疑 难 解 答 资 源I/O 防 护 故 障 排 除疑 难 解 答 通 知全 局 集 群 的 故 障 排 除 与 恢 复对 steward 进 程 进 行 故 障 排 除授 权 许 可 故 障 排 除VCS 消 息 日 志 记 录VCS 生 成 两 种 类 型 的 日 志 : 引 擎 日 志 和 代 理 日 志 。 日 志 文 件 名 中 会 追 加 字 母 后 缀 。字 母 A 指 示 第 一 个 日 志 文 件 ,B 指 示 第 二 个 日 志 文 件 ,C 指 示 第 三 个 日 志 文 件 , 依此 类 推 。引 擎 日 志 位 于 /var/VRTSvcs/log/engine_A.log。 引 擎 日 志 消 息 的 格 式 为 :


126VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录Timestamp (Year/MM/DD) | Mnemonic | Severity | UMI| Message Text■ Timestamp: 消 息 生 成 的 日 期 和 时 间 。■■■Mnemonic: 代 表 产 品 的 字 符 串 ID( 例 如 VCS)。Severity: 一 些 级 别 , 包 括 CRITICAL、ERROR、WARNING、NOTICE 和 INFO( 分 别 表 示 从 最 严 重 到 最 不 严 重 )。UMI: 唯 一 的 消 息 ID。■ Message Text: 由 VCS 生 成 的 实 际 消 息 。典 型 的 引 擎 日 志 如 下 所 示 :2011/07/10 16:08:09 VCS INFO V-16-1-10077 Received newcluster membership代 理 日 志 位 于 /var/VRTSvcs/log/.log。 代 理 日 志 消 息 的 格 式 如 下 所 示 :Timestamp (Year/MM/DD) | Mnemonic | Severity | UMI | Agent Type | ResourceName | Entry Point | Message Text典 型 的 代 理 日 志 如 下 所 示 :2011/07/10 10:38:23 VCS WARNING V-16-2-23331Oracle:VRT:monitor:Open for ora_lgwr failed, settingcookie to null.请 注 意 , 并 非 所 有 节 点 上 的 日 志 都 相 同 , 原 因 如 下 :■ VCS 记 录 本 地 节 点 上 的 本 地 事 件 。■ 当 某 个 事 件 发 生 时 , 并 非 所 有 节 点 都 在 运 行 。VCS 将 警 告 和 错 误 消 息 输 出 至 STDERR。如 果 VCS 引 擎 、Comm<strong>and</strong> Server 或 任 何 VCS 代 理 遇 到 问 题 , 则 会 生 成 首 次 故 障数 据 捕 获 (FFDC) 日 志 , 并 随 其 他 核 心 转 储 和 堆 栈 跟 踪 一 起 转 储 到 以 下 位 置 :■■■对 于 VCS 引 擎 :$VCS_DIAG/diag/had对 于 Comm<strong>and</strong> Server:$VCS_DIAG/diag/CmdServer对 于 VCS 代 理 :$VCS_DIAG/diag/agents/type, 其 中 type 表 示 具 体 的 代 理 类型 。变 量 $VCS_DIAG 的 默 认 值 为 /var/VRTSvcs/。如 果 没 有 打 开 调 试 日 志 记 录 , 则 这 些 FFDC 日 志 对 于 分 析 需 要 专 业 支 持 的 问 题 很 有用 。


VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录127GAB 消 息 日 志 记 录如 果 GAB 遇 到 某 个 问 题 , 则 还 会 生 成 并 转 储 首 次 故 障 数 据 捕 获 (FFDC) 日 志 。配 置 GAB 后 ,GAB 也 会 启 动 GAB 日 志 记 录 后 台 驻 留 程 序 (/opt/VRTSgab/gablogd)。默 认 情 况 下 启 用 GAB 日 志 记 录 后 台 驻 留 程 序 。 可 更 改 GAB 可 调 参 数 gab_ibuf_count的 值 以 禁 用 GAB 日 志 记 录 后 台 驻 留 程 序 。此 GAB 日 志 记 录 后 台 驻 留 程 序 在 发 生 严 重 事 件 ( 例 如 iofence), 或 在 发 生 任 何GAB 端 口 的 主 节 点 故 障 时 收 集 GAB 相 关 的 日 志 , 并 以 压 缩 二 进 制 格 式 存 储 数 据 。可 使 用 以 下 gabread_ffdc 实 用 程 序 读 取 GAB 二 进 制 日 志 文 件 :/opt/VRTSgab/gabread_ffdcbinary_logs_files_location可 更 改 下 列 控 制 GAB 二 进 制 日 志 文 件 的 环 境 变 量 的 值 :■■GAB_FFDC_MAX_INDX: 定 义 最 大 GAB 二 进 制 日 志 文 件 数GAB 日 志 记 录 后 台 驻 留 程 序 收 集 定 义 数 量 的 日 志 文 件 , 每 个 文 件 大 小 为 8 MB。默 认 值 为 20, 文 件 以 从 gablog.1 到 gablog.20 的 方 式 命 名 。 无 论 在 任 何 时 候 ,最 新 的 文 件 都 是 gablog.1 文 件 。GAB_FFDC_LOGDIR: 为 GAB 二 进 制 日 志 文 件 定 义 日 志 目 录 位 置默 认 位 置 为 :/var/adm/gab_ffdc请 注 意 ,gablog 后 台 驻 留 程 序 将 其 日 志 写 入 位 于 相 同 目 录 中 的 glgd_A.log 和glgd_B.log 文 件 。可 以 在 以 下 GAB 启 动 文 件 中 定 义 这 些 变 量 , 也 可 以 使 用 export 命 令 。 要 使 更 改 生效 , 必 须 重 新 启 动 GAB。/etc/rc.config.d/gabconf为 代 理 启 用 调 试 日 志本 节 介 绍 如 何 为 VCS 代 理 启 用 调 试 日 志 。为 代 理 启 用 调 试 日 志1 将 配 置 设 置 为 读 写 :# haconf -makerw2 启 用 日 志 记 录 并 设 置 所 需 的 日 志 级 别 。 以 下 示 例 说 明 了 用 于 IPMultiNIC 资 源类 型 的 命 令 。# hatype -modify IPMultiNIC LogDbg DBG_1 DBG_2 DBG_4 DBG_21有 关 更 多 信 息 , 请 参 见 LogDbg 属 性 的 说 明 。


128VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录3 对 于 基 于 脚 本 的 代 理 , 运 行 halog 命 令 将 消 息 添 加 至 引 擎 日 志 :# halog -addtags DBG_1 DBG_2 DBG_4 DBG_214 保 存 该 配 置 。# haconf -dump -makero启 用 IMF 的 调 试 日 志如 果 设 置 了 DBG_AGDEBUG, 代 理 实 例 的 代 理 框 架 日 志 出 现 在 运 行 代 理 的 节 点 上的 代 理 日 志 中 。运 行 以 下 命 令 , 启 用 智 能 监 视 框 架 (IMF) 的 其 他 调 试 日 志 。 将 在 特 定 于 代 理 的/var/VRTSvcs/log/agentname_A.log 日 志 文 件 中 记 录 这 些 消 息 。请 参 见 第 140 页 的 “ 智 能 监 视 框 架 (IMF) 故 障 排 除 ”。启 用 其 他 调 试 日 志1 对 于 Process、Mount 和 应 用 程 序 代 理 :# hatype -modify agentname LogDbgDBG_AGDEBUG DBG_AGTRACE DBG_AGINFO DBG_1 DBG_2DBG_3 DBG_4 DBG_5 DBG_6 DBG_72 对 于 Oracle 和 Netlsnr 代 理 :# hatype -modify agentname LogDbgDBG_AGDEBUG DBG_AGTRACE DBG_AGINFO DBG_1 DBG_2DBG_3 DBG_4 DBG_5 DBG_6 DBG_7DBG_8 DBG_9 DBG_103 对 于 CFSMount 代 理 :# hatype -modify agentname LogDbgDBG_AGDEBUG DBG_AGTRACE DBG_AGINFO DBG_1 DBG_2DBG_3 DBG_4 DBG_5 DBG_6 DBG_7DBG_8 DBG_9 DBG_10 DBG_11 DBG_12DBG_13 DBG_14 DBG_15 DBG_16DBG_17 DBG_18 DBG_19 DBG_20 DBG_21


VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录129对 VCS 引 擎 启 用 调 试 日 志4 对 于 CVMvxconfigd 代 理 , 不 必 启 用 其 他 任 何 调 试 日 志 。5 对 于 AMF 驱 动 程 序 内 存 跟 踪 缓 冲 区 :# amfconfig -S errlevel all all如 果 已 启 用 AMF 驱 动 程 序 内 存 跟 踪 缓 冲 区 , 可 使 用 amfconfig -p dbglog 命令 查 看 其 他 日 志 。您 可 以 通 过 以 下 两 种 方 法 对 VCS 引 擎 、VCS 代 理 和 HA 命 令 启 用 调 试 日 志 :■ 要 在 运 行 时 启 用 调 试 日 志 , 请 使 用 halog -addtags 命 令 。■要 在 启 动 时 启 用 调 试 日 志 , 请 使 用 VCS_DEBUG_LOG_TAGS 环 境 变 量 。 必 须先 设 置 VCS_DEBUG_LOG_TAGS, 然 后 再 启 动 HAD 或 运 行 HA 命 令 。例 如 :# export VCS_DEBUG_LOG_TAGS="DBG_TRACE DBG_POLICY"# hastart# export VCS_DEBUG_LOG_TAGS="DBG_AGINFO DBG_AGDEBUG DBG_AGTRACE"# hastart# export VCS_DEBUG_LOG_TAGS="DBG_IPM"# hagrp -list注 意 : 调 试 日 志 消 息 是 十 分 详 细 的 。 如 果 启 用 调 试 日 志 , 则 日 志 文 件 可 能 会 很 快 填满 。关 于 调 试 日 志 标 记 用 法下 表 说 明 了 调 试 标 记 的 用 法 :实 体代 理 函 数代 理 框 架所 使 用 的 调 试 日 志DBG_1 到 DBG_21DBG_AGTRACEDBG_AGDEBUGDBG_AGINFO


130VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录实 体Icmp 代 理所 使 用 的 调 试 日 志DBG_HBFW_TRACEDBG_HBFW_DEBUGDBG_HBFW_INFOHADDBG_AGENT( 用 于 与 代 理 相 关 的 调 试 日 志 )DBG_ALERTS( 用 于 警 报 调 试 日 志 )DBG_CTEAM( 用 于 GCO 调 试 日 志 )DBG_GAB、DBG_GABIO( 用 于 GAB 调 试 消 息 )DBG_GC( 用 于 对 每 个 日 志 消 息 显 示 全 局 计 数 器 )DBG_INTERNAL( 用 于 内 部 消 息 )DBG_IPM( 用 于 进 程 间 消 息 传 送 )DBG_JOIN( 用 于 结 合 逻 辑 )DBG_LIC( 用 于 与 授 权 相 关 的 消 息 )DBG_NTEVENT( 用 于 NT 事 件 日 志 )DBG_POLICY( 用 于 引 擎 策 略 )DBG_RSM( 用 于 RSM 调 试 消 息 )DBG_TRACE( 用 于 跟 踪 消 息 )DBG_SECURITY( 用 于 与 安 全 相 关 的 消 息 )DBG_LOCK( 用 于 调 试 锁 基 元 )DBG_THREAD( 用 于 调 试 线 程 基 元 )DBG_HOSTMON( 用 于 HostMonitor 调 试 日 志 )收 集 VCS 信 息 以 进 行 支 持 分 析遇 到 VCS 问 题 时 , 必 须 运 行 hagetcf 命 令 收 集 信 息 。<strong>Symantec</strong> 技 术 支 持 使 用 这 些脚 本 的 输 出 帮 助 分 析 和 解 决 所 有 VCS 问 题 。hagetcf 命 令 收 集 关 于 安 装 的 软 件 、 集群 配 置 、 系 统 、 日 志 的 信 息 和 相 关 信 息 并 创 建 gzip 文 件 。有 关 更 多 信 息 , 请 参 见 hagetcf(1M) 手 册 页 。


VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录131收 集 VCS 信 息 以 进 行 支 持 分 析◆ 在 每 个 节 点 上 运 行 以 下 命 令 :# /opt/VRTSvcs/bin/hagetcf该 命 令 会 提 示 您 指 定 gzip 文 件 的 输 出 目 录 。 可 以 将 gzip 文 件 保 存 到 默 认 的/tmp 目 录 或 其 他 目 录 。进 行 故 障 排 除 并 解 决 问 题 。请 参 见 第 133 页 的 “VCS 引 擎 故 障 排 除 ”。请 参 见 第 139 页 的 “VCS 启 动 故 障 排 除 ”。请 参 见 第 142 页 的 “ 疑 难 解 答 服 务 组 ”。请 参 见 第 145 页 的 “ 疑 难 解 答 资 源 ”。请 参 见 第 162 页 的 “ 疑 难 解 答 通 知 ”。请 参 见 第 162 页 的 “ 全 局 集 群 的 故 障 排 除 与 恢 复 ”。请 参 见 第 165 页 的 “ 对 steward 进 程 进 行 故 障 排 除 ”。如 果 问 题 无 法 解 决 , 请 联 系 <strong>Symantec</strong> 技 术 支 持 部 门 , 并 提 供 hagetcf 命 令 所生 成 的 文 件 。收 集 LLT 和 GAB 信 息 以 进 行 支 持 分 析当 LLT 和 GAB 出 现 问 题 时 , 必 须 运 行 getcomms 脚 本 来 收 集 LLT 和 GAB 信 息 。getcomms 脚 本 收 集 LLT 和 GAB 信 息 的 同 时 , 还 收 集 核 心 转 储 和 堆 栈 跟 踪 。


132VCS 的 故 障 排 除 与 恢 复VCS 消 息 日 志 记 录收 集 LLT 和 GAB 信 息 以 进 行 支 持 分 析1 如 果 已 更 改 GAB_FFDC_LOGDIR 参 数 的 默 认 值 , 则 必 须 重 新 导 出 同 一 变 量 才能 运 行 getcomms 脚 本 。请 参 见 第 127 页 的 “GAB 消 息 日 志 记 录 ”。2 运 行 以 下 命 令 以 收 集 信 息 :# /opt/VRTSgab/getcomms默 认 情 况 下 , 该 脚 本 使 用 remsh。 确 保 您 配 置 了 无 密 码 的 remsh。 如 果 在 集 群节 点 之 间 有 无 密 码 的 ssh, 则 可 以 使 用 -ssh 选 项 。 要 在 运 行 该 命 令 的 节 点 上 收集 信 息 , 请 使 用 -local 选 项 。进 行 故 障 排 除 并 解 决 问 题 。请 参 见 第 135 页 的 “Low Latency Transport (LLT) 故 障 排 除 ”。请 参 见 第 138 页 的 “Group Membership Services/Atomic Broadcast (GAB) 故 障排 除 ”。如 果 问 题 无 法 解 决 , 请 联 系 <strong>Symantec</strong> 技 术 支 持 部 门 , 并 提 供 getcomms 脚 本所 生 成 的 /tmp/commslog.time_stamp.tar 文 件 。收 集 IMF 信 息 以 进 行 支 持 分 析遇 到 IMF( 智 能 监 视 框 架 ) 问 题 时 , 必 须 运 行 getimf 脚 本 以 收 集 信 息 。收 集 IMF 信 息 以 进 行 支 持 分 析◆ 在 每 个 节 点 上 运 行 以 下 命 令 :# /opt/VRTSamf/bin/getimf进 行 故 障 排 除 并 解 决 问 题 。请 参 见 第 140 页 的 “ 智 能 监 视 框 架 (IMF) 故 障 排 除 ”。如 果 无 法 解 决 问 题 , 请 与 <strong>Symantec</strong> 技 术 支 持 联 系 , 并 提 供 getimf 脚 本 生 成的 文 件 。消 息 目 录VCS 对 消 息 目 录 提 供 多 语 言 支 持 。 这 些 二 进 制 消 息 目 录 (BMC) 存 储 在 以 下 默 认 位 置中 。 变 量 language 代 表 一 个 两 字 母 的 语 言 名 称 缩 写 。/opt/VRTS/messages/language/module_nameVCS 命 令 行 界 面 以 VCS 支 持 的 语 言 显 示 错 误 消 息 和 成 功 消 息 。hamsg 命 令 以 VCS支 持 的 语 言 显 示 VCS 引 擎 日 志 。


VCS 的 故 障 排 除 与 恢 复VCS 引 擎 故 障 排 除133BMC 包 括 :gcoconfig.bmcVRTSvcsHbfw.bmcVRTSvcsTriggers.bmcVRTSvcsWac.bmcvxfen*.bmcgab.bmchagetcf.bmcllt.bmcVRTSvcsAgfw.bmcVRTSvcsAlerts.bmcVRTSvcsApi.bmcVRTSvcsCommon.bmcVRTSvcsHad.bmcVRTSvcsplatformAgent.bmcVRTSvcsplatformagent_name.bmcgcoconfig 消 息心 跳 框 架 消 息VCS 触 发 器 消 息广 域 连 接 器 进 程 消 息防 护 消 息GAB 命 令 行 界 面 消 息hagetcf 消 息LLT 命 令 行 界 面 消 息代 理 框 架 消 息VCS 警 报 消 息VCS API 消 息通 用 模 块 消 息VCS 引 擎 (HAD) 消 息VCS 捆 绑 代 理 消 息VCS Enterprise Agent 消 息VCS 引 擎 故 障 排 除本 主 题 包 含 有 关 VCS 引 擎 故 障 排 除 的 信 息 。请 参 见 第 135 页 的 “ 联 机 前 IP 检 查 ”。HAD 诊 断当 VCS 引 擎 HAD 转 储 核 心 时 , 会 将 核 心 写 入 到 目 录 $VCS_DIAG/diag/had 中 。 变量 $VCS_DIAG 的 默 认 值 是 /var/VRTSvcs/。当 HAD 进 行 核 心 转 储 时 , 请 查 看 $VCS_DIAG/diag/had 目 录 的 内 容 。 请 参 见 以 下日 志 以 获 取 更 多 信 息 :■■■操 作 系 统 控 制 台 日 志引 擎 日 志hashadow 日 志


134VCS 的 故 障 排 除 与 恢 复VCS 引 擎 故 障 排 除HAD 连 续 重 新 启 动当 HAD 和 GAB 遇 到 心 跳 问 题 时 ,VCS 运 行 脚 本 /opt/VRTSvcs/bin/vcs_diag 来收 集 诊 断 信 息 。 诊 断 信 息 存 储 在 $VCS_DIAG/diag/had 目 录 中 。当 HAD 启 动 时 , 它 会 将 此 目 录 重 命 名 为 had.timestamp, 其 中 timestamp 表 示 此目 录 的 重 命 名 时 间 。当 您 使 用 hastart 命 令 启 动 HAD 时 ,HAD 可 能 会 连 续 重 新 启 动 。 系 统 无 法 进 入RUNNING 状 态 并 丢 失 其 端 口 h 成 员 集 。建 议 的 操 作 : 检 查 engine_A.log 文 件 中 是 否 存 在 带 有 标 识 符 V-16-1-10125 的 消息 。 下 面 的 消 息 是 一 个 示 例 :VCS INFO V-16-1-10125 GAB timeout set to 30000 ms (VCS INFO V-16-1-10125GAB 超 时 设 置 为 30000 毫 秒 )该 值 指 示 为 了 使 HAD 向 GAB 注 册 心 跳 而 设 置 的 超 时 。 如 果 系 统 负 载 较 重 , 则 30秒 超 时 可 能 不 足 , 无 法 使 HAD 向 GAB 注 册 心 跳 。 请 根 据 需 要 将 该 超 时 设 置 为 适 当的 较 大 值 。DNS 配 置 问 题 导 致 GAB 终 止 HAD种 子 设 定 和 I/O 防 护如 果 HAD 定 期 被 GAB 因 不 明 原 因 而 终 止 , 请 查 看 HAD 核 心 文 件 以 确 定 堆 栈 跟 踪中 是 否 出 现 了 DNS 解 析 函 数 (res_send()、res_query()、res_search() 等 等 )。 出现 DNS 解 析 函 数 可 能 表 示 存 在 DNS 配 置 问 题 。VCS 高 可 用 性 后 台 驻 留 程 序 (HAD) 使 用 gethostbyname() 函 数 。 在 UNIX 平 台 上 ,如 果 文 件 /etc/nsswitch.conf 的 主 机 条 目 中 有 DNS, 则 调 用 gethostbyname() 函数 可 导 致 调 用 DNS 解 析 方 法 。如 果 无 法 访 问 /etc/resolve.conf 中 指 定 的 名 称 服 务 器 或 存 在 DNS 配 置 问 题 , 则调 用 的 DNS 解 析 方 法 可 能 阻 止 HAD, 从 而 导 致 HAD 不 能 及 时 将 心 跳 发 送 到 GAB。当 I/O 防 护 启 动 时 , 会 执 行 一 项 检 查 , 以 确 保 在 协 调 点 上 具 有 键 的 系 统 也 位 于 GAB成 员 集 中 。 如 果 /etc/gabtab 中 的 gabconfig 命 令 允 许 集 群 在 少 于 集 群 系 统 总 数的 系 统 上 设 定 种 子 , 或 者 使 用 gabconfig -x 命 令 强 制 集 群 设 定 种 子 , 则 很 可 能 此项 检 查 将 不 匹 配 。 在 这 种 情 况 下 , 防 护 模 块 将 检 测 可 能 的 裂 脑 情 况 , 显 示 相 应 的 错误 , 而 且 HAD 不 会 启 动 。当 集 群 的 所 有 成 员 之 间 可 以 互 换 心 跳 信 号 时 , 建 议 使 集 群 自 动 设 定 种 子 。 在 这 种 情况 下 , 所 有 系 统 在 加 入 GAB 成 员 集 后 都 会 执 行 I/O 防 护 键 放 置 。


VCS 的 故 障 排 除 与 恢 复Low Latency Transport (LLT) 故 障 排 除135联 机 前 IP 检 查您 可 以 启 用 故 障 转 移 IP 地 址 的 联 机 前 检 查 , 以 防 止 发 生 网 络 分 裂 。 此 项 检 查 会 对 服务 组 的 已 配 置 IP 地 址 运 行 ping 命 令 , 以 验 证 它 未 在 使 用 中 。 如 果 它 已 在 使 用 中 ,则 服 务 组 不 会 进 入 联 机 状 态 。另 一 项 检 查 验 证 系 统 是 否 连 接 到 其 公 共 网 络 和 专 用 网 络 。 如 果 系 统 在 对 公 共 网 络 进行 广 播 ping 时 和 对 专 用 网 络 进 行 检 查 时 未 收 到 响 应 , 则 会 确 定 系 统 是 独 立 的 并 且 不会 使 服 务 组 联 机 。要 启 用 联 机 前 IP 检 查 , 请 执 行 下 列 操 作 之 一 :■如 果 preonline 触 发 器 脚 本 不 存 在 , 请 将 sample_triggers 目 录 中 的 preonline触 发 器 脚 本 复 制 到 triggers 目 录 :# cp /opt/VRTSvcs/bin/sample_triggers/VRTSvcs/preonline_ipc/opt/VRTSvcs/bin/triggers/preonline更 改 文 件 权 限 使 它 成 为 可 执 行 文 件 。■■如 果 preonline 触 发 器 脚 本 已 存 在 , 请 创 建 一 个 诸 如 /preonline 的 目 录 , 并 将现 有 preonline 触 发 器 以 T0preonline 的 形 式 移 到 该 目 录 。 将 preonline_ipc 触发 器 以 T1preonline 的 形 式 复 制 到 同 一 目 录 。如 果 您 使 用 了 多 个 触 发 器 , 请 以 TNpreonline 的 形 式 复 制 preonline_ipc 触 发器 , 其 中 TN 是 下 一 个 更 大 的 TNumber。Low Latency Transport (LLT) 故 障 排 除本 节 包 含 与 Low Latency Transport (LLT) 关 联 的 错 误 消 息 , 并 提 供 了 说 明 和 建 议的 操 作 。LLT 启 动 脚 本 显 示 错 误如 果 网 络 中 有 多 个 系 统 具 有 相 同 的 clusterid-nodeid 对 和 相 同 的 以 太 网 SAP/UDP端 口 , 则 LLT 启 动 脚 本 会 显 示 如 下 所 示 的 错 误 消 息 :LLT lltconfig ERROR V-14-2-15238 node 1 already existsin cluster 8383 <strong>and</strong> has the address - 00:18:8B:E4:DE:27LLT lltconfig ERROR V-14-2-15241 LLT not configured,use -o to override this warningLLT lltconfig ERROR V-14-2-15664 LLT could notconfigure any linkLLT lltconfig ERROR V-14-2-15245 cluster id 1 isalready being used by nid 0 <strong>and</strong> has theaddress - 00:04:23:AC:24:2D


136VCS 的 故 障 排 除 与 恢 复Low Latency Transport (LLT) 故 障 排 除LLT lltconfig ERROR V-14-2-15664 LLT could notconfigure any link建 议 的 操 作 : 请 确 保 网 络 上 的 所 有 系 统 都 具 有 唯 一 的 clusterid-nodeid 对 。 您 可 以使 用 lltdump -f device -D 命 令 获 取 连 接 到 网 络 的 唯 一 clusterid-nodeid 对 的 列表 。 该 实 用 程 序 仅 适 用 于 LLT over Ethernet。LLT 检 测 到 使 用 了 交 叉 链 路如 果 LLT 检 测 到 系 统 的 多 个 链 路 连 接 到 了 同 一 个 网 络 , 则 LLT 会 在 syslog 中 记 录类 似 如 下 内 容 的 警 告 消 息 :LLT WARNING V-14-1-10498 recvarpack cross links? links 0 <strong>and</strong> 2 sawthe same peer link number 1 for node 1建 议 的 操 作 : 这 是 一 条 信 息 性 消 息 。LLT 支 持 交 叉 链 路 。 但 是 , 如 果 该 交 叉 链 路 不是 有 意 网 络 设 置 , 请 确 保 没 有 两 个 链 路 从 同 一 系 统 连 接 至 同 一 网 络 。 也 就 是 说 , 不同 的 LLT 链 路 需 要 位 于 不 同 的 网 络 。LLT 链 路 状 态 消 息表 14-1 描 述 了 LLT 日 志 消 息 , 例 如 syslog 中 链 路 的 故 障 、 活 动 、 非 活 动 或 过 期 状态 。表 14-1LLT 链 路 状 态 消 息消 息LLT INFO V-14-1-10205link 1 (link_name) node 1 in trouble说 明 和 建 议 的 操 作此 消 息 意 味 着 LLT 没 有 接 收 到 来 自 LLT peertrouble 时 间 的 指示 对 等 节 点 中 指 示 链 路 上 的 任 何 心 跳 。 对 于 高 优 先 级 链 路 , 默认 的 LLT peertrouble 时 间 是 2 秒 , 对 于 低 优 先 级 链 路 是 4秒 。建 议 的 操 作 : 如 果 这 些 消 息 只 是 偶 尔 出 现 在 syslog 中 , 可 以将 其 忽 略 。 如 果 这 些 消 息 大 量 充 斥 syslog, 请 执 行 下 列 操 作 之一 :■将 peertrouble 时 间 增 加 为 更 高 的 值 ( 但 是 要 远 远 低 于peerinact 值 )。 运 行 以 下 命 令 :lltconfig -T peertrouble:for hipri linklltconfig -T peertroublelo:for lopri links.有 关 详 细 信 息 , 请 参 见 lltconfig(1m) 手 册 页 。■ 替 换 LLT 链 路 。


VCS 的 故 障 排 除 与 恢 复Low Latency Transport (LLT) 故 障 排 除137消 息LLT INFO V-14-1-10024link 0 (link_name) node 1 activeLLT INFO V-14-1-10032link 1 (link_name) node 1 inactive 5sec (510)说 明 和 建 议 的 操 作此 消 息 意 味 着 LLT 启 动 后 将 在 该 节 点 中 看 到 此 链 路 上 的 心 跳 。建 议 的 操 作 : 不 需 要 执 行 任 何 操 作 。 该 消 息 是 信 息 性 消 息 。此 消 息 意 味 着 LLT 未 接 收 到 来 自 指 示 时 间 段 的 指 示 对 等 节 点中 指 示 链 路 上 的 任 何 心 跳 。如 果 对 等 节 点 实 际 上 没 有 断 开 , 请 检 查 以 下 情 况 :■ 检 查 链 路 是 否 以 物 理 方 式 断 开 了 与 系 统 或 交 换 机 的 连 接 。■ 检 查 链 路 的 运 行 状 况 , 并 在 必 要 时 替 换 链 路 。LLT INFO V-14-1-10510 sent hbreq(NULL) on link 1 (link_name) node 1.4 more to go.LLT INFO V-14-1-10510 sent hbreq(NULL) on link 1 (link_name) node 1.3 more to go.LLT INFO V-14-1-10510 sent hbreq(NULL) on link 1 (link_name) node 1.2 more to go.LLT INFO V-14-1-10032 link 1(link_name) node 1 inactive 6 sec(510)LLT INFO V-14-1-10510 sent hbreq(NULL) on link 1 (link_name) node 1.1 more to go.LLT INFO V-14-1-10510 sent hbreq(NULL) on link 1 (link_name) node 1.0 more to go.LLT INFO V-14-1-10032 link 1(link_name) node 1 inactive 7 sec(510)LLT INFO V-14-1-10509 link 1(link_name) node 1 expired此 消 息 意 味 着 LLT 在 未 接 收 到 LLT peerinact 时 间 以 上 的 指 示对 等 节 点 中 指 示 链 路 上 的 任 何 心 跳 。LLT 会 尝 试 请 求 心 跳 机 制( 向 对 等 节 点 发 送 5 次 hbreq), 如 果 对 等 节 点 没 有 响 应 ,LLT 将 针 对 该 对 等 节 点 将 此 链 路 标 记 为 “ 过 期 ”。建 议 的 操 作 : 如 果 对 等 节 点 实 际 上 没 有 断 开 , 请 检 查 以 下 情况 :■ 检 查 链 路 是 否 以 物 理 方 式 断 开 了 与 系 统 或 交 换 机 的 连 接 。■ 检 查 链 路 的 运 行 状 况 , 并 在 必 要 时 替 换 链 路 。LLT INFO V-14-1-10499 recvarpreqlink 0 for node 1 addr change from00:00:00:00:00:00 to00:18:8B:E4:DE:27当 LLT 获 知 对 等 节 点 的 地 址 时 , 会 记 录 此 消 息 。建 议 的 操 作 : 不 需 要 执 行 任 何 操 作 。 该 消 息 是 信 息 性 消 息 。


138VCS 的 故 障 排 除 与 恢 复Group Membership Services/Atomic Broadcast (GAB) 故 障 排 除消 息说 明 和 建 议 的 操 作在 检 测 到 链 路 故 障 的 本 地 节 点 上 :LLT INFO V-14-1-10519 link 0 downLLT INFO V-14-1-10585 local link 0 downfor 1 secLLT INFO V-14-1-10586 send linkdown_ntfon link 1 for local link 0LLT INFO V-14-1-10590 recv linkdown_ackfrom node 1 on link 1 for local link 0LLT INFO V-14-1-10592 received ack fromall the connected nodes在 对 等 节 点 上 :LLT INFO V-14-1-10589 recvlinkdown_ntf from node 0 on link 1for peer link 0LLT INFO V-14-1-10587 send linkdown_ackto node 0 on link 1 for peer link 0如 果 您 启 用 了 LLT 以 更 快 地 检 测 链 路 故 障 , 则 会 显 示 这 些 消息 。 当 链 路 出 现 故 障 或 与 节 点 断 开 连 接 时 ( 电 缆 拔 出 、 交 换 机故 障 等 ), 本 地 节 点 上 的 LLT 会 检 测 到 此 情 况 并 通 过 LLT 隐藏 链 路 将 相 关 信 息 传 播 到 所 有 对 等 节 点 。 在 本 地 节 点 上 的 LLT收 到 所 有 节 点 的 确 认 之 后 , 该 LLT 会 将 此 链 路 标 记 为 断 开 连接 。Group Membership Services/Atomic Broadcast (GAB)故 障 排 除端 口 在 重 新 打 开 时 出 现 延 迟本 节 包 括 与 Group Membership Services/Atomic Broadcast (GAB) 关 联 的 错 误 消息 , 并 提 供 了 说 明 和 建 议 的 操 作 。如 果 在 LLT 状 态 清 除 操 作 完 成 之 前 将 GAB 端 口 关 闭 并 重 新 打 开 , 则 GAB 会 记 录 类似 如 下 内 容 的 消 息 :GAB INFO V-15-1-20102 Port v: delayed reopen建 议 的 操 作 : 如 果 在 GAB 重 新 配 置 期 间 发 生 此 问 题 , 并 且 没 有 重 复 发 生 , 则 此 问 题是 良 性 的 。 如 果 问 题 仍 然 存 在 , 请 从 每 个 节 点 中 收 集 commslog, 并 与 <strong>Symantec</strong>支 持 联 系 。


VCS 的 故 障 排 除 与 恢 复VCS 启 动 故 障 排 除139由 于 客 户 端 进 程 故 障 , 导 致 节 点 混 乱如 果 VCS 后 台 驻 留 程 序 在 VCS_GAB_TIMEOUT( 默 认 值 为 30 秒 ) 环 境 变 量 指 定的 配 置 超 时 时 间 内 没 有 向 GAB 发 送 心 跳 , 则 节 点 会 发 生 混 乱 , 并 显 示 类 似 如 下 内 容的 消 息 :GAB Port h halting node due to client process failure at 3:109如 果 VCS 停 滞 在 处 于 不 可 中 断 状 态 的 内 核 中 , 或 者 系 统 负 载 较 重 , 使 得 VCS 后 台驻 留 程 序 无 法 使 用 SIGKILL 停 止 , 则 GAB 终 止 VCS 后 台 驻 留 程 序 的 尝 试 ( 重 试 五次 ) 会 失 败 。建 议 的 操 作 :■如 果 是 性 能 问 题 , 请 增 加 VCS_GAB_TIMEOUT 环 境 变 量 的 值 , 以 允 许 VCS 有更 长 的 时 间 发 送 心 跳 。■如 果 是 内 核 问 题 , 请 将 GAB 配 置 为 不 发 生 混 乱 但 继 续 尝 试 停 止 VCS 后 台 驻 留 程序 。执 行 以 下 任 务 :■ 在 每 个 节 点 上 运 行 以 下 命 令 :gabconfig -k■ 在 /etc/gabtab 文 件 中 将 -k 选 项 添 加 到 gabconfig 命 令 :gabconfig -c -k -n 6■如 果 问 题 仍 然 存 在 , 请 收 集 sar 或 类 似 输 出 以 及 崩 溃 转 储 , 并 与 <strong>Symantec</strong> 支 持联 系 。VCS 启 动 故 障 排 除本 主 题 包 括 与 启 动 VCS 相 关 的 错 误 消 息 ( 以 粗 体 文 本 显 示 ), 并 对 每 个 错 误 及 建 议的 操 作 进 行 了 说 明 。VCS:10622 local configuration missing本 地 配 置 缺 失 。建 议 的 操 作 : 在 另 一 个 具 有 有 效 配 置 文 件 的 系 统 上 启 动 VCS 引 擎 HAD。 出 现 配 置错 误 的 系 统 从 其 他 系 统 中 提 取 有 效 配 置 。另 一 种 方 法 就 是 在 本 地 系 统 上 安 装 配 置 文 件 , 并 强 制 VCS 重 新 读 取 该 配 置 文 件 。 如果 该 文 件 看 起 来 有 效 , 则 验 证 它 不 是 早 期 版 本 。


140VCS 的 故 障 排 除 与 恢 复智 能 监 视 框 架 (IMF) 故 障 排 除键 入 以 下 命 令 验 证 配 置 :# cd /etc/VRTSvcs/conf/config# hacf -verifyVCS:10623 local configuration invalid本 地 配 置 无 效 。建 议 的 操 作 : 在 另 一 个 具 有 有 效 配 置 文 件 的 系 统 上 启 动 VCS 引 擎 HAD。 出 现 配 置错 误 的 系 统 从 其 他 系 统 中 提 取 有 效 配 置 。另 一 种 方 法 就 是 更 正 本 地 系 统 上 的 配 置 文 件 , 并 强 制 VCS 重 新 读 取 该 配 置 文 件 。 如果 该 文 件 看 起 来 有 效 , 则 验 证 它 不 是 早 期 版 本 。键 入 以 下 命 令 验 证 配 置 :# cd /etc/VRTSvcs/conf/config# hacf -verifyVCS:11032 registration failed.ExitingGAB 没 有 注 册 过 或 者 已 经 取 消 注 册 。建 议 的 操 作 : 使 用 /etc/gabtab 文 件 中 的 gabconfig 命 令 注 册 GAB。 验 证 该 文 件 是否 存 在 以 及 它 是 否 包 含 命 令 gabconfig -c。如 果 LLT 设 置 不 正 确 , 则 GAB 可 能 会 取 消 注 册 。 验 证 /etc/llttab 中 的 配 置 是 否 正确 。 如 果 LLT 配 置 不 正 确 , 则 进 行 适 当 的 更 改 并 重 新 启 动 。Waiting for cluster membership.此 消 息 表 明 GAB 无 法 设 定 种 子 。 如 果 是 这 种 情 况 , 则 gabconfig -a 命 令 不 显 示 任何 成 员 , 并 可 能 在 控 制 台 上 或 事 件 日 志 中 显 示 以 下 消 息 。GAB: Port a registration waiting for seed port membershipGAB: Port h registration waiting for seed port membership智 能 监 视 框 架 (IMF) 故 障 排 除查 看 下 列 日 志 以 对 智 能 监 视 框 架 (IMF) 的 相 关 问 题 进 行 隔 离 和 故 障 排 除 :■■■给 定 操 作 系 统 的 系 统 控 制 台 日 志VCS 引 擎 日 志 :/var/VRTSvcs/log/engine_A.log特 定 于 代 理 的 日 志 :/var/VRTSvcs/log/agentname_A.log


VCS 的 故 障 排 除 与 恢 复智 能 监 视 框 架 (IMF) 故 障 排 除141■AMF 内 存 中 跟 踪 缓 冲 区 : 使 用 amfconfig -p dbglog 命 令 查 看 内 容请 参 见 第 128 页 的 “ 启 用 IMF 的 调 试 日 志 ”。请 参 见 第 132 页 的 “ 收 集 IMF 信 息 以 进 行 支 持 分 析 ”。表 14-2 列 出 了 智 能 资 源 监 视 的 最 常 见 问 题 , 并 提 供 了 故 障 排 除 和 解 决 问 题 的 说 明 。表 14-2与 IMF 相 关 的 问 题 和 建 议 的 操 作问 题智 能 资 源 监 视 并 未 降 低系 统 利 用 率说 明 和 建 议 的 操 作如 果 在 启 用 了 智 能 资 源 监 视 后 系 统 依 然 繁 忙 , 请 按 如 下 所 示 进 行 故 障 排 除 :■ 检 查 代 理 日 志 文 件 以 查 看 imf_init 代 理 函 数 是 否 失 败 。如 果 imf_init 代 理 函 数 失 败 , 则 执 行 以 下 操 作 :■ 确 保 将 AMF_START 环 境 变 量 值 设 置 为 1。■ 确 保 已 加 载 AMF 模 块 。■ 确 保 为 以 下 属 性 键 设 置 了 正 确 的 IMF 属 性 值 :■ 必 须 将 IMF 属 性 的 Mode 键 的 值 设 置 为 1、2 或 3。■ 必 须 将 IMF 属 性 的 MonitorFreq 键 的 值 设 置 为 0 或 大 于 0 的 值 。例 如 , 可 以 将 Process 代 理 的 MonitorFreq 键 的 值 设 置 为 0。 有 关 与 可 识 别 IMF 的 代理 对 应 的 配 置 建 议 , 请 参 考 相 应 的 代 理 文 档 。请 注 意 , 可 以 覆 盖 IMF 属 性 。 因 此 , 如 果 针 对 单 个 资 源 设 置 属 性 , 请 检 查 单 个 资 源的 值 。■ 验 证 是 否 已 在 AMF 驱 动 程 序 中 注 册 这 些 资 源 。 检 查 amfstat 命 令 输 出 。■检 查 代 理 的 LevelTwoMonitorFreq 属 性 设 置 。 例 如 ,Process 代 理 必 须 将 此 属 性 值 设 置为 0。有 关 与 可 识 别 IMF 的 代 理 对 应 的 配 置 建 议 , 请 参 考 相 应 的 代 理 文 档 。启 用 代 理 的 智 能 监 视 不立 即 提 供 性 能 结 果只 有 在 达 到 稳 定 状 态 后 才 会 启 动 资 源 的 实 际 智 能 监 视 。 因 此 , 启 用 IMF 后 需 要 一 段 时 间 才能 看 到 对 性 能 的 正 面 影 响 。 这 是 预 期 的 行 为 。有 关 何 时 达 到 稳 定 状 态 的 更 多 信 息 , 请 参 见 以 下 主 题 :尽 管 将 IMF 模 式 设 置 为3, 但 代 理 仍 不 执 行 智 能监 视对 于 使 用 AMF 驱 动 程 序 进 行 IMF 通 知 的 代 理 , 如 果 智 能 资 源 监 视 尚 未 生 效 , 请 执 行 以 下 操作 :■ 确 保 将 IMF 属 性 的 Mode 键 值 设 置 为 三 (3)。■查 看 代 理 日 志 以 确 认 在 AMF 中 注 册 imf_init() 代 理 已 成 功 。 必 须 在 启 动 代 理 之 前 加载 AMF 驱 动 程 序 , 因 为 代 理 在 启 动 时 在 AMF 中 注 册 。 如 果 并 非 如 此 , 则 先 启 动 AMF模 块 再 重 新 启 动 代 理 。


142VCS 的 故 障 排 除 与 恢 复疑 难 解 答 服 务 组问 题尽 管 将 IMF 模 式 更 改 为0, 但 AMF 模 块 仍 无 法卸 载说 明 和 建 议 的 操 作即 使 将 Mode 键 的 值 更 改 为 0 后 , 代 理 仍 继 续 控 制 AMF 驱 动 程 序 , 直 到 终 止 代 理 为 止 。 要卸 载 AMF 模 块 , 必 须 释 放 对 它 的 所 有 控 制 。如 果 将 IMF 模 式 值 更 改 为 0 后 AMF 模 块 仍 无 法 卸 载 , 请 执 行 以 下 操 作 :■ 运 行 amfconfig -Uof 命 令 。 此 命 令 强 制 删 除 对 模 块 的 所 有 控 制 并 取 消 配 置 该 模 块 。■然 后 , 卸 载 AMF。尝 试 为 代 理 启 用 IMF时 ,haimfconfig-enable -agent 命 令 将返 回 一 条 消 息 , 指 出 已为 该 代 理 启 用 IMF。 但是 , 当 VCS 和 相 关 代 理运 行 时 ,haimfconfig-display 命 令 会 将agent_name 的 状 态 显 示为 DISABLED。出 现 此 行 为 的 部 分 可 能 原 因 如 下 所 示 :■ 此 代 理 可 能 需 要 一 些 手 动 步 骤 才 能 识 别 IMF。 有 关 这 些 手 动 步 骤 , 请 参 考 代 理 文 档 。■此 代 理 为 自 定 义 代 理 , 且 无 法 识 别 IMF。 有 关 如 何 使 自 定 义 代 理 识 别 IMF 的 信 息 , 请 参见 《<strong>Veritas</strong> Cluster Server Agent 开 发 指 南 》。■ 如 果 之 前 的 步 骤 无 法 解 决 此 问 题 , 请 联 系 <strong>Symantec</strong> 技 术 支 持 部 门 。疑 难 解 答 服 务 组本 主 题 介 绍 与 使 服 务 组 联 机 和 脱 机 相 关 的 最 常 见 问 题 。 粗 体 文 本 提 供 问 题 的 说 明 。还 包 括 建 议 的 操 作 ( 如 果 适 用 )。VCS 不 会 自 动 启 动 服 务 组如 果 集 群 中 的 VCS 引 擎 (HAD) 是 由 hashadow 进 程 重 新 启 动 的 , 则 VCS 不 会 自 动启 动 故 障 转 移 服 务 组 。此 行 为 可 防 止 服 务 组 由 于 发 生 某 些 事 件 ( 如 GAB 因 高 负 载 而 终 止 HAD, 或 HAD自 行 终 止 以 纠 正 意 外 的 错 误 情 况 ) 而 自 动 联 机 。系 统 未 处 于 RUNNING 状 态建 议 的 操 作 : 键 入 hasys -display system 以 检 查 系 统 状 态 。 当 系 统 未 处 于 运 行状 态 时 , 如 果 未 发 现 问 题 , 就 可 以 启 动 VCS。服 务 组 未 配 置 为 在 该 系 统 上 运 行服 务 组 的 SystemList 属 性 可 能 不 包 含 该 系 统 的 名 称 。建 议 的 操 作 : 使 用 hagrp -display service_group 命 令 的 输 出 验 证 系 统 名 称 。


VCS 的 故 障 排 除 与 恢 复疑 难 解 答 服 务 组143服 务 组 未 配 置 为 自 动 启 动如 果 服 务 组 在 系 统 上 不 自 动 启 动 , 则 该 组 可 能 未 配 置 为 自 动 启 动 , 或 者 可 能 未 配 置为 在 特 定 系 统 上 自 动 启 动 。建 议 的 操 作 : 使 用 hagrp -display service_group AutoStartList node_list命 令 的 输 出 验 证 AutoStart 和 AutoStartList 属 性 的 值 。服 务 组 已 冻 结建 议 的 操 作 : 使 用 hagrp -display service_group 命 令 的 输 出 验 证 Frozen 和TFrozen 属 性 的 值 。 使 用 hagrp -unfreeze 命 令 对 该 组 取 消 冻 结 。 请 注 意 ,VCS不 会 使 冻 结 的 服 务 组 脱 机 。故 障 转 移 服 务 组 在 另 一 个 系 统 上 处 于 联 机 状 态某 个 关 键 资 源 出 现 故 障该 组 是 故 障 转 移 组 , 并 且 在 另 一 个 系 统 上 处 于 联 机 状 态 或 部 分 联 机 状 态 。建 议 的 操 作 : 使 用 hagrp -display service_group 命 令 的 输 出 验 证 State 属 性 的值 。 使 用 hagrp -offline 命 令 使 组 在 另 一 个 系 统 上 脱 机 。hagrp -display service_group 命 令 的 输 出 表 明 服 务 组 出 现 故 障 。建 议 的 操 作 : 使 用 hares -clear 命 令 清 除 该 故 障 。已 自 动 禁 用 服 务 组当 VCS 不 了 解 特 定 系 统 上 服 务 组 的 状 态 时 , 它 会 自 动 禁 用 该 系 统 上 的 服 务 组 。 在以 下 情 况 下 会 发 生 自 动 禁 用 :■ 当 VCS 引 擎 HAD 未 在 系 统 上 运 行 时 。在 这 些 情 况 下 , 在 其 SystemList 属 性 中 包 括 该 系 统 的 所 有 服 务 组 都 会 被 自 动 禁用 。 这 不 适 用 于 断 电 的 系 统 。■ 当 在 系 统 上 未 探 查 到 服 务 组 内 的 所 有 资 源 时 。建 议 的 操 作 : 使 用 hagrp -display service_group 命 令 的 输 出 验 证 AutoDisabled属 性 的 值 。


144VCS 的 故 障 排 除 与 恢 复疑 难 解 答 服 务 组警 告 : 要 在 VCS 自 动 禁 用 某 个 组 后 手 动 使 该 组 联 机 , 请 确 保 该 组 在 AutoDisabled属 性 已 由 VCS 设 置 为 1 的 任 何 系 统 上 未 处 于 完 全 或 部 分 活 动 状 态 。 具 体 地 说 , 验证 可 能 会 因 在 多 个 系 统 上 处 于 活 动 状 态 而 受 损 的 所 有 资 源 在 指 定 的 系 统 上 处 于 关 闭状 态 。 然 后 , 为 每 个 系 统 清 除 AutoDisabled 属 性 :# hagrp -autoenableservice_group -sys system服 务 组 正 在 等 待 资 源 联 机 / 脱 机建 议 的 操 作 : 查 看 服 务 组 中 所 有 资 源 的 IState 属 性 , 确 定 哪 些 资 源 正 在 等 待 进 入 联机 状 态 ( 或 哪 些 资 源 正 在 等 待 进 入 脱 机 状 态 )。 使 用 hastatus 命 令 可 帮 助 识 别 这些 资 源 。 请 参 见 /var/VRTSvcs/log 中 的 引 擎 日 志 和 代 理 日 志 , 以 获 取 有 关 资 源 无法 联 机 或 脱 机 的 原 因 的 信 息 。要 清 除 此 状 态 , 请 确 保 正 在 等 待 进 入 联 机 / 脱 机 状 态 的 所 有 资 源 不 会 自 行 联 机 / 脱 机 。使 用 hagrp -flush 命 令 或 hagrp -flush -force 命 令 清 除 VCS 的 内 部 状 态 。 然后 , 可 以 使 服 务 组 在 另 一 个 系 统 上 联 机 或 脱 机 。有 关 hagrp -flush 和 hagrp -flush -force 命 令 的 更 多 信 息 :警 告 : 请 谨 慎 使 用 -force 选 项 。 此 选 项 可 能 导 致 无 意 中 将 资 源 状 态 返 回 为FAULTED。 在 资 源 从 WAITING TO GO ONLINE 转 换 为 NOT WAITING 的 时 间 间隔 中 , 如 果 代 理 未 完 成 offline 代 理 函 数 , 则 该 代 理 可 能 会 将 资 源 的 状 态 返 回 为OFFLINE。VCS 会 将 资 源 的 会 将 资 源 的 意 外 脱 机 视 为 意 外 脱 机 视 为 FAULT, 并 启动 不 必 要 的 恢 复 操 作 。服 务 组 正 在 等 待 某 个 依 赖 关 系 得 到 满 足未 完 全 探 查 到 服 务 组建 议 的 操 作 : 要 查 看 未 满 足 哪 些 依 赖 关 系 , 请 键 入 hagrp -dep service_group 查看 服 务 组 依 赖 关 系 , 或 者 键 入 hares -dep resource 查 看 资 源 依 赖 关 系 。如 果 代 理 进 程 没 有 对 服 务 组 中 的 每 一 个 资 源 都 加 以 监 视 , 则 会 出 现 这 种 情 况 。VCS引 擎 HAD 启 动 时 , 会 立 即 “ 探 查 ” 以 查 找 所 有 资 源 的 初 始 状 态 。 ( 如 果 代 理 没 有返 回 值 , 则 它 不 能 进 行 探 查 。) 在 VCS 尝 试 使 服 务 组 作 为 AutoStart 的 一 部 分 进行 联 机 之 前 , 必 须 在 SystemList 属 性 中 包 含 的 所 有 系 统 上 对 该 组 进 行 探 查 。 这 可确 保 即 使 服 务 组 在 VCS 启 动 之 前 就 处 于 联 机 状 态 ,VCS 也 不 会 无 意 间 使 该 服 务 组 在另 一 个 系 统 上 联 机 。建 议 的 操 作 : 使 用 hagrp -display service_group 的 输 出 查 看 系 统 服 务 组 的ProbesPending 属 性 值 。( 该 值 应 为 0。) 要 确 定 未 探 查 到 哪 些 资 源 , 请 验 证 指 定系 统 上 的 每 个 资 源 的 本 地 Probed 属 性 。0 表 示 正 在 等 待 探 查 结 果 ,1 表 示 已 探 查 ,2 表 示 未 引 导 VCS。 请 参 见 引 擎 日 志 和 代 理 日 志 以 获 取 有 关 信 息 。


VCS 的 故 障 排 除 与 恢 复疑 难 解 答 资 源145疑 难 解 答 资 源本 主 题 介 绍 与 使 资 源 联 机 和 脱 机 相 关 的 最 常 见 问 题 。 粗 体 文 本 提 供 问 题 的 说 明 。 还包 括 建 议 的 操 作 ( 如 果 适 用 )。由 于 故 障 转 移 而 使 服 务 组 联 机正 在 等 待 服 务 组 状 态正 在 等 待 子 资 源正 在 等 待 父 资 源正 在 等 待 资 源 响 应VCS 尝 试 使 已 在 出 故 障 的 系 统 上 联 机 或 正 在 联 机 的 资 源 联 机 。 每 个 父 资 源 必 须 等 待其 子 资 源 联 机 后 才 能 启 动 。建 议 的 操 作 : 验 证 子 资 源 是 否 处 于 联 机 状 态 。服 务 组 的 状 态 可 防 止 VCS 使 资 源 联 机 。建 议 的 操 作 : 查 看 服 务 组 的 状 态 。父 资 源 的 一 个 或 多 个 子 资 源 处 于 脱 机 状 态 。建 议 的 操 作 : 先 使 子 资 源 联 机 。一 个 或 多 个 父 资 源 处 于 联 机 状 态 。建 议 的 操 作 : 先 使 父 资 源 脱 机 。请 参 见 第 145 页 的 “ 疑 难 解 答 资 源 ”。资 源 正 根 据 指 示 等 待 进 入 联 机 或 脱 机 状 态 。VCS 指 示 代 理 运 行 资 源 的 online 入 口点 。建 议 的 操 作 : 验 证 资 源 的 IState 属 性 。 请 参 见 /var/VRTSvcs/engine_A.log <strong>and</strong>/var/VRTSvcs/agent_A.log 中 的 引 擎 和 代 理 日 志 , 以 获 取 有 关 资 源 无 法 联 机 的 原 因的 信 息 。代 理 未 运 行资 源 的 代 理 进 程 未 运 行 。建 议 的 操 作 : 使 用 hastatus -summary 查 看 该 代 理 是 否 被 列 为 faulted。 重 新 启 动该 代 理 :


146VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除# haagent -start resource_type -sys system无 效 的 代 理 参 数 列 表脚 本 正 在 接 收 不 正 确 的 参 数 。建 议 的 操 作 : 验 证 脚 本 的 参 数 是 否 正 确 。 使 用 hares -display resource 的 输 出查 看 ArgListValues 属 性 的 值 。 如 果 动 态 地 更 改 了 ArgList 属 性 , 则 停 止 代 理 并 重新 启 动 它 。停 止 代 理 :◆# haagent -stop resource_type -sys system重 新 启 动 代 理◆# haagent -start resource_type -sys system磁 盘 组 代 理 的 Monitor 入 口 点 返 回 ONLINE, 即 使 磁 盘 组 已 被 禁 用 也是 如 此这 是 预 期 的 代 理 行 为 。 VCS 假 定 正 在 从 卷 读 取 数 据 或 将 数 据 写 入 卷 中 , 并 且 不 将 资源 声 明 为 脱 机 。 这 可 防 止 可 能 由 在 两 个 主 机 上 导 入 的 磁 盘 组 所 导 致 的 潜 在 数 据 损坏 。当 完 成 所 有 I/O 操 作 或 关 闭 所 有 卷 后 , 可 以 逐 出 禁 用 的 磁 盘 组 。 然 后 , 可 以 将 磁 盘组 重 新 导 入 到 同 一 系 统 中 。 重 新 导 入 禁 用 的 磁 盘 组 可 能 需 要 重 新 启 动 系 统 。注 意 : 如 果 大 量 磁 盘 的 专 用 区 域 中 的 数 据 ( 包 括 内 核 日 志 、 配 置 副 本 或 头 文 件 ) 无效 或 不 可 访 问 , 则 禁 用 磁 盘 组 。 如 果 不 需 要 对 磁 盘 专 用 区 域 进 行 任 何 更 改 , 则 卷 可以 执 行 读 写 操 作 。I/O 防 护 故 障 排 除以 下 各 节 介 绍 了 I/O 防 护 问 题 的 故 障 排 除 。 查 看 症 状 和 建 议 的 解 决 方 案 。


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除147正 在 逐 出 某 个 节 点 时 , 另 一 个 节 点 不 能 加 入 集 群如 果 某 个 集 群 当 前 正 在 隔 离 ( 逐 出 ) 某 个 节 点 , 在 防 护 操 作 完 成 之 前 , 该 集 群 将 阻止 新 节 点 加 入 其 中 。 下 面 是 针 对 新 节 点 在 控 制 台 上 显 示 的 消 息 示 例 :...VxFEN ERROR V-11-1-25 ... Unable to join running clustersince cluster is currently fencinga node out of the cluster.如 果 在 引 导 新 节 点 时 出 现 了 这 些 消 息 , 该 节 点 上 的 vxfen 启 动 脚 本 便 会 做 出 五 次 加入 集 群 的 尝 试 。当 I/O 防 护 尝 试 失 败 时 手 动 将 节 点 加 入 到 此 集 群 中◆如 果 vxfen 脚 本 尝 试 允 许 该 节 点 加 入 此 集 群 失 败 , 请 使 用 以 下 命 令 重 新 启 动vxfen 驱 动 程 序 :# /sbin/init.d/vxfen stop# /sbin/init.d/vxfen start如 果 该 命 令 失 败 , 请 重 新 启 动 新 节 点 。当 SCSI TEST UNIT READY 命 令 失 败 时 ,vxfentsthdw 实 用 程 序 将 失 败运 行 vxfentsthdw 实 用 程 序 时 , 可 能 会 看 到 一 条 如 下 所 示 的 消 息 :Issuing SCSI TEST UNIT READY to disk reserved by other nodeFAILED.Contact the storage provider to have the hardware configurationfixed.当 有 其 他 主 机 使 用 SCSI-3 持 久 性 保 留 保 留 磁 盘 时 , 磁 盘 阵 列 不 支 持 SCSI TESTUNIT READY 命 令 返 回 成 功 。 如 果 系 统 模 式 选 项 “186 位 ” 未 启 用 ,Hitachi DataSystems 99XX 阵 列 将 出 现 此 情 况 。手 动 删 除 SCSI-3 磁 盘 中 的 现 有 键查 看 从 磁 盘 删 除 由 其 他 节 点 创 建 的 特 定 注 册 键 和 保 留 键 的 以 下 过 程 。


148VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除注 意 : 如 果 要 清 除 所 有 现 有 键 , 请 使 用 vxfenclearpre 实 用 程 序 。从 磁 盘 删 除 注 册 键 和 保 留 键1 创 建 包 含 磁 盘 访 问 名 的 文 件 :# vi /tmp/disklist例 如 :/dev/rdsk/c1t12d02 读 取 现 有 键 :# vxfenadm -s all -f /tmp/disklist此 命 令 的 输 出 显 示 该 键 :Device Name: /dev/rdsk/c1t12d0Total Number Of Keys: 1key[0]:[Numeric Format]: 86,70,66,69,65,68,48,50[Character Format]: VFBEAD02[Node Format]: Cluster ID: 48813 Node ID: 2Node Name: unknown3 如 果 您 知 道 创 建 键 ( 假 定 为 A1) 的 节 点 , 请 登 录 到 该 节 点 并 输 入 以 下 命 令 :# vxfenadm -x -kA1 -f /tmp/disklist这 样 就 会 删 除 A1 键 。4 如 果 您 不 知 道 该 键 是 在 哪 个 节 点 上 创 建 的 , 则 执 行 5 到 7 来 删 除 该 键 。5 临 时 向 磁 盘 注 册 另 一 个 键 A2:# vxfenadm -m -k A2 -f /tmp/disklistRegistration completed for disk path /dev/rdsk/c1t12d0


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除1496 通 过 用 第 二 个 键 先 占 磁 盘 , 将 第 一 个 键 从 磁 盘 删 除 :# vxfenadm -p -kA2 -f /tmp/disklist -vA1key: A2------ prempted the key: A1------ on disk/dev/rdsk/c1t12d07 删 除 在 5 中 注 册 的 临 时 键 。# vxfenadm -x -kA2 -f /tmp/disklistDeleted the key : [A2------] from device /dev/rdsk/c1t12d0磁 盘 上 将 不 再 存 在 注 册 键 。为 防 止 潜 在 数 据 损 坏 , 系 统 发 生 混 乱节 点 遇 到 裂 脑 情 况 并 从 集 群 逐 出 时 , 该 节 点 将 发 生 混 乱 并 显 示 以 下 控 制 台 消 息 :VXFEN:vxfen_plat_panic: Local cluster node ejected from cluster toprevent potential data corruption.当 节 点 由 于 所 有 专 用 互 连 失 败 或 节 点 挂 起 而 无 法 与 对 等 节 点 保 持 心 跳 时 , 将 遇 到 裂脑 情 况 。 请 检 查 不 同 情 况 下 的 I/O 防 护 行 为 以 及 要 采 取 的 纠 正 措 施 。请 参 见 第 149 页 的 “I/O 防 护 在 不 同 事 件 情 形 下 的 工 作 方 式 ”。I/O 防 护 在 不 同 事 件 情 形 下 的 工 作 方 式表 14-3 介 绍 了 在 不 同 的 故 障 事 件 情 形 下 ,I/O 防 护 如 何 防 止 数 据 损 坏 。 针 对 各 种 情况 , 查 看 操 作 员 应 采 取 的 纠 正 操 作 。表 14-3I/O 防 护 情 形事 件节 点 A: 出 现 的 情况节 点 B: 出 现 的 情况操 作 员 操 作两 个 专 用 网 络 均 出 现故 障 。节 点 A 会 争 夺 大 部 分协 调 点 。如 果 节 点 A 在 对 协 调点 的 争 夺 中 获 胜 , 则节 点 A 会 将 节 点 B 逐出 共 享 磁 盘 , 然 后 继续 运 行 。节 点 B 会 争 夺 大 部 分协 调 点 。如 果 节 点 B 在 对 协 调点 的 争 夺 中 失 败 , 节点 B 会 发 生 混 乱 并 自行 从 集 群 中 删 除 。节 点 B 被 逐 出 集 群 之后 , 请 先 修 复 专 用 网络 , 然 后 再 尝 试 使 节点 B 重 新 返 回 到 集 群中 。


150VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除事 件节 点 A: 出 现 的 情况节 点 B: 出 现 的 情况操 作 员 操 作发 生 上 述 事 件 之 后 ,两 个 专 用 网 络 重 新 恢复 运 行 。节 点 A 继 续 运 行 。节 点 B 已 经 崩 溃 , 它不 能 启 动 数 据 库 , 因为 无 法 向 数 据 磁 盘 写入 数 据 。还 原 专 用 网 络 之 后 ,重 新 启 动 节 点 B。一 个 专 用 网 络 发 生 故障 。节 点 A 挂 起 。节 点 A 会 在 控 制 台 上输 出 有 关 IOFENCE 的消 息 , 并 继 续 运 行 。节 点 A 由 于 某 种 原 因非 常 忙 或 节 点 A 处 于内 核 调 试 程 序 中 。节 点 A 不 再 挂 起 或 不再 处 于 内 核 调 试 程 序中 时 , 所 有 已 排 队 的针 对 数 据 磁 盘 的 写 入操 作 均 会 失 败 , 因 为节 点 A 已 被 逐 出 。 当节 点 A 从 GAB 收 到 有关 被 逐 出 的 消 息 之后 , 会 发 生 混 乱 并 自行 从 集 群 中 删 除 。节 点 B 会 在 控 制 台 上输 出 有 关 IOFENCE 的消 息 , 并 继 续 运 行 。节 点 B 失 去 与 节 点 A之 间 的 心 跳 链 接 , 并争 夺 大 部 分 协 调 点 。节 点 B 在 对 协 调 点 的争 夺 中 获 胜 , 并 将 节点 A 逐 出 共 享 数 据 磁盘 。修 复 专 用 网 络 。 修 复网 络 之 后 , 两 个 节 点就 可 自 动 使 用 网 络了 。修 复 或 调 试 挂 起 的 节点 , 并 重 新 启 动 该 节点 以 便 重 新 加 入 集群 。


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除151事 件节 点 A: 出 现 的 情况节 点 B: 出 现 的 情况操 作 员 操 作节 点 A 和 节 点 B 以 及专 用 网 络 断 电 。 而 协调 点 和 数 据 磁 盘 的 电源 正 常 供 电 。节 点 的 电 源 恢 复 供电 , 节 点 重 新 启 动 ,但 专 用 网 络 仍 然 无 法正 常 运 行 。节 点 A 重 新 启 动 ,I/O防 护 驱 动 程 序 (vxfen)检 测 到 节 点 B 向 协 调点 进 行 了 注 册 。 驱 动程 序 没 有 在 集 群 成 员表 中 看 到 节 点 B, 因为 专 用 网 络 已 断 开 。这 会 导 致 I/O 防 护 设备 驱 动 程 序 阻 止 节 点A 加 入 集 群 。 节 点 A控 制 台 会 显 示 以 下 消息 :节 点 B 重 新 启 动 ,I/O防 护 驱 动 程 序 (vxfen)检 测 到 节 点 A 向 协 调点 进 行 了 注 册 。 驱 动程 序 没 有 在 集 群 成 员表 中 看 到 节 点 A, 因为 专 用 网 络 已 断 开 。这 会 导 致 I/O 防 护 设备 驱 动 程 序 阻 止 节 点B 加 入 集 群 。 节 点 B控 制 台 会 显 示 以 下 消息 :解 决 已 有 的 裂 脑 情况 。请 参 见 第 154 页 的 “ 防护 启 动 报 告 已 有 的 裂脑 ”。Potentially apreexistingsplit brain.Dropping outof the cluster.Refer to theuserdocumentationfor stepsrequiredto clearpreexistingsplit brain.Potentially apreexistingsplit brain.Dropping outof the cluster.Refer to theuserdocumentationfor stepsrequiredto clearpreexistingsplit brain.


152VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除事 件节 点 A: 出 现 的 情况节 点 B: 出 现 的 情况操 作 员 操 作节 点 A 崩 溃 而 节 点 B停 机 。 节 点 B 恢 复 正常 运 行 而 节 点 A 仍 然停 机 。节 点 A 崩 溃 。节 点 B 重 新 启 动 并 且检 测 到 节 点 A 向 协 调点 进 行 了 注 册 。 驱 动程 序 没 有 在 集 群 成 员表 中 看 到 节 点 A。I/O防 护 设 备 驱 动 程 序 会在 控 制 台 上 输 出 以 下消 息 :Potentially apreexistingsplit brain.Dropping outof the cluster.Refer to theuserdocumentationfor stepsrequiredto clearpreexistingsplit brain.解 决 已 有 的 裂 脑 情况 。请 参 见 第 154 页 的 “ 防护 启 动 报 告 已 有 的 裂脑 ”。包 含 三 个 协 调 点 中 的两 个 协 调 点 的 磁 盘 阵列 断 电 。没 有 任 何 节 点 脱 离 集群 成 员 集只 要 任 何 节 点 都 没 有脱 离 集 群 , 节 点 A 就会 继 续 运 行 。只 要 任 何 节 点 都 没 有脱 离 集 群 , 节 点 B 就会 继 续 运 行 。打 开 发 生 故 障 的 磁 盘阵 列 的 电 源 , 以 便 后续 网 络 分 裂 不 会 导 致集 群 关 闭 ; 或 者 更 换协 调 点 。包 含 三 个 协 调 点 中 的两 个 协 调 点 的 磁 盘 阵列 断 电 。节 点 B 正 常 脱 离 集群 , 磁 盘 阵 列 仍 处 于断 电 状 态 。 正 常 脱 离意 味 着 干 净 的 关 闭 ,从 而 可 以 正 确 取 消 配置 vxfen。节 点 A 在 集 群 中 继 续运 行 。节 点 B 已 脱 离 集 群 。打 开 发 生 故 障 的 磁 盘阵 列 的 电 源 , 以 便 后续 网 络 分 裂 不 会 导 致集 群 关 闭 ; 或 者 更 换协 调 点 。


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除153事 件节 点 A: 出 现 的 情况节 点 B: 出 现 的 情况操 作 员 操 作包 含 三 个 协 调 点 中 的两 个 协 调 点 的 磁 盘 阵列 断 电 。节 点 B 突 然 崩 溃 , 或者 在 节 点 A 和 节 点 B之 间 出 现 网 络 分 裂 ,且 磁 盘 阵 列 仍 处 于 断电 状 态 。节 点 A 会 争 夺 大 部 分协 调 点 。 节 点 A 发 生故 障 , 因 为 三 个 协 调点 中 只 有 一 个 是 可 用的 。 节 点 A 会 发 生 混乱 并 自 行 从 集 群 中 删除 。节 点 B 由 于 崩 溃 或 网络 分 裂 已 脱 离 集 群 。打 开 发 生 故 障 的 磁 盘阵 列 的 电 源 , 并 重 新启 动 I/O 防 护 驱 动 程序 , 使 节 点 A 能 够 向所 有 协 调 点 进 行 注册 ; 或 者 更 换 协 调点 。请 参 见 第 157 页 的 “ 集群 脱 机 时 替 换 损 坏 的磁 盘 ”。协 调 器 磁 盘 的 I/O 防 护 键 上 的 集 群 ID 与 本 地 集 群 的 ID 不 匹 配如 果 您 意 外 地 将 一 个 集 群 的 协 调 器 磁 盘 分 配 给 另 一 个 集 群 , 则 在 启 动 I/O 防 护 时 ,防 护 驱 动 程 序 会 显 示 类 似 如 下 内 容 的 错 误 消 息 :000068 06:37:33 2bdd5845 0 ... 3066 0 VXFEN WARNING V-11-1-56Coordinator disk has key with cluster id 48813which does not match local cluster id 57069该 警 告 意 味 着 集 群 ID 为 57069 的 本 地 集 群 拥 有 键 。 但 是 ,ID 为 48813 的 集 群 也 在磁 盘 上 拥 有 键 , 这 表 明 集 群 ID 为 48813 的 集 群 中 的 节 点 可 能 会 使 用 同 一 个 协 调 器磁 盘 。您 可 以 运 行 下 列 命 令 来 验 证 这 些 磁 盘 是 否 由 另 一 个 集 群 使 用 。 在 本 地 集 群 的 其 中 一个 节 点 上 运 行 以 下 命 令 。 例 如 , 在 system01 上 :system01> # lltstat -C57069system01> # cat /etc/vxfentab/dev/vx/rdmp/disk_7/dev/vx/rdmp/disk_8/dev/vx/rdmp/disk_9system01> # vxfenadm -s /dev/vx/rdmp/disk_7Reading SCSI Registration Keys...Device Name: /dev/vx/rdmp/disk_7Total Number Of Keys: 1key[0]:[Numeric Format]: 86,70,48,49,52,66,48,48


154VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除[Character Format]: VFBEAD00[Node Format]: Cluster ID: 48813 Node ID: 0 Node Name: unknown其 中 disk_7、disk_8 和 disk_9 表 示 设 置 中 的 磁 盘 名 称 。建 议 的 操 作 : 必 须 为 每 个 集 群 使 用 唯 一 的 协 调 器 磁 盘 组 。 如 果 其 他 集 群 没 有 使 用 这些 协 调 器 磁 盘 , 则 在 本 地 集 群 中 将 其 用 作 协 调 器 磁 盘 之 前 , 请 使 用 vxfenclearpre命 令 清 除 键 。防 护 启 动 报 告 已 有 的 裂 脑运 行 vxfen 驱 动 程 序 , 可 防 止 已 逐 出 的 节 点 在 从 专 用 网 络 链 接 断 开 后 到 这 些 链 路 修复 之 前 的 这 段 时 间 内 重 新 加 入 该 集 群 。例 如 , 假 设 专 用 网 络 链 接 断 开 后 , 系 统 1 和 系 统 2 的 集 群 仍 可 正 常 运 行 。 同 时 假 设系 统 1 为 已 逐 出 的 系 统 。 当 系 统 1 在 专 用 网 络 链 接 还 原 之 前 重 新 启 动 时 , 其 成 员 集配 置 不 会 显 示 系 统 2; 但 是 , 当 它 尝 试 向 协 调 器 磁 盘 进 行 注 册 时 , 会 发 现 系 统 2 已向 协 调 器 磁 盘 注 册 。 假 设 出 现 了 有 关 系 统 2 的 此 冲 突 信 息 , 系 统 1 将 不 加 入 此 集 群并 通 过 vxfenconfig 返 回 类 似 以 下 内 容 的 错 误 消 息 :vxfenconfig: ERROR: There exists the potential for a preexistingsplit-brain. The coordinator disks list no nodes which are inthe current membership. However, they also list nodes which arenot in the current membership.I/O Fencing Disabled!注 意 : 在 系 统 引 导 期 间 , 由 于 HP-UX rc 定 序 器 将 所 有 rc 脚 本 的 stderr 重 定 向 到 文件 /etc/rc.log, 因 此 不 会 在 控 制 台 上 显 示 错 误 消 息 。 将 在 /etc/rc.log 文 件 中 记 录 该信 息 。此 外 , 在 控 制 台 上 还 会 显 示 以 下 信 息 : vxfen: WARNING: Potentially a preexisting split-brain. Dropping out of cluster. Refer to user documentation for steps required to clear preexisting split-brain. I/O Fencing DISABLED! gab: GAB:20032: Port b closed


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除155注 意 : 如 果 使 用 -D 选 项 配 置 了 syslogd, 则 在 控 制 台 上 不 会 显 示 信 息 性 消 息 。 将 在系 统 缓 冲 区 中 记 录 这 些 消 息 。 可 以 使 用 dmesg 命 令 从 系 统 缓 冲 区 进 行 读 取 。但 是 , 当 专 用 网 络 链 接 正 常 运 行 , 而 这 两 个 系 统 都 停 机 时 , 也 会 显 示 同 样 的 错 误 消息 , 这 时 系 统 1 重 新 启 动 , 而 系 统 2 则 无 法 恢 复 。 从 系 统 1 中 的 集 群 来 看 , 系 统 2可 能 仍 注 册 在 协 调 点 上 。假 定 下 列 情 形 以 了 解 在 基 于 服 务 器 的 防 护 中 的 已 有 裂 脑 :■■有 三 个 CP 服 务 器 充 当 协 调 点 。 然 后 , 这 三 个 CP 服 务 器 中 的 其 中 一 个 变 得 无 法访 问 。 在 此 状 态 下 , 一 个 客 户 端 节 点 离 开 集 群 , 其 注 册 无 法 从 不 可 访 问 的 CP 服务 器 中 删 除 。 当 不 可 访 问 的 CP 服 务 器 重 新 启 动 时 , 它 有 一 个 来 自 脱 离 了 VCS 的节 点 的 失 效 注 册 。 在 这 种 情 况 下 , 任 何 新 节 点 都 不 能 加 入 集 群 。 每 个 尝 试 加 入集 群 的 节 点 会 从 CP 服 务 器 中 获 得 一 个 注 册 列 表 。 一 个 CP 服 务 器 包 括 一 个 ( 先前 离 开 的 节 点 ) 的 额 外 注 册 。 这 使 得 加 入 者 节 点 推 断 , 在 它 与 失 效 注 册 所 表 示的 节 点 之 间 存 在 已 有 的 裂 脑 。所 有 客 户 端 节 点 已 同 时 崩 溃 , 因 而 未 从 CP 服 务 器 清 除 防 护 键 。 因 此 , 节 点 重 新启 动 时 ,vxfen 配 置 无 法 报 告 已 有 的 裂 脑 。这 些 情 形 类 似 于 协 调 器 磁 盘 的 已 有 裂 脑 情 况 , 在 那 些 情 况 下 , 您 可 以 通 过 运 行vxfenclearpre 命 令 来 解 决 问 题 。 在 基 于 服 务 器 的 防 护 中 需 要 使 用 cpsadm 命 令 解决 类 似 的 问 题 。请 参 见 第 155 页 的 “ 清 除 已 有 的 裂 脑 情 况 ”。清 除 已 有 的 裂 脑 情 况查 看 有 关 VxFEN 驱 动 程 序 如 何 检 查 已 有 裂 脑 情 况 的 信 息 。请 参 见 第 154 页 的 “ 防 护 启 动 报 告 已 有 的 裂 脑 ”。表 14-4 描 述 了 如 何 根 据 您 遇 到 的 情 形 解 决 已 有 的 裂 脑 情 况 :表 14-4清 除 已 有 裂 脑 情 况 的 建 议 解 决 方 案情 况实 际 潜 在 裂 脑 情 况 - 系 统2 正 在 运 行 , 系 统 1 被 逐出解 决 方 案1 确 定 系 统 1 是 否 正 在 运 行 。2 如 果 系 统 1 在 正 常 运 行 , 请 将 其 关 闭 并 修 复 专 用 网 络 链 接 以 消 除 裂 脑 情 况 。3 重 新 启 动 系 统 1。


156VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除情 况表 面 潜 在 裂 脑 情 况 - 系 统2 宕 机 , 系 统 1 被 逐 出( 已 配 置 基 于 磁 盘 的 防护 )解 决 方 案1 物 理 验 证 系 统 2 是 否 停 机 。验 证 系 统 当 前 是 否 已 注 册 到 协 调 点 。对 协 调 器 磁 盘 使 用 以 下 命 令 :# vxfenadm -s all -f /etc/vxfentab该 命 令 的 输 出 会 标 识 注 册 到 协 调 器 磁 盘 的 键 。2 使 用 vxfenclearpre 命 令 清 除 协 调 器 磁 盘 上 的 键 和 所 有 共 享 磁 盘 组 中 的 数 据 磁 盘 。该 命 令 删 除 SCSI-3 注 册 和 保 留 。3 对 系 统 2 进 行 所 有 必 要 的 修 复 。4 重 新 启 动 系 统 2。表 面 潜 在 裂 脑 情 况 - 系 统2 宕 机 , 系 统 1 被 逐 出( 已 配 置 基 于 服 务 器 的防 护 )1 物 理 验 证 系 统 2 是 否 停 机 。验 证 系 统 当 前 是 否 已 注 册 到 协 调 点 。对 CP 服 务 器 使 用 以 下 命 令 :# cpsadm -s cp_server -a list_membership-c cluster_name其 中 ,cp_server 是 配 置 CP 服 务 器 所 在 的 虚 拟 IP 地 址 或 虚 拟 主 机 名 ,cluster_name 是SFHA Solutions 集 群 ( 应 用 集 群 ) 的 VCS 名 称 。该 命 令 列 出 向 CP 服 务 器 注 册 的 系 统 。2 使 用 cpsadm 命 令 清 除 CP 服 务 器 上 的 键 。cpsadm 命 令 可 清 除 CP 服 务 器 上 的 注 册 :# cpsadm -s cp_server -a unreg_node-c cluster_name -n nodeid其 中 ,cp_server 是 CP 服 务 器 正 在 侦 听 的 虚 拟 IP 地 址 或 虚 拟 主 机 名 ,cluster_name 是VCS 的 VCS 名 称 , 而 nodeid 指 定 VCS 节 点 的 节 点 ID。 确 保 在 CP 服 务 器 上 清 除 节 点注 册 之 前 未 在 节 点 上 运 行 防 护 。删 除 所 有 失 效 注 册 后 , 要 加 入 的 节 点 将 可 以 加 入 集 群 。3 对 系 统 2 进 行 所 有 必 要 的 修 复 。4 重 新 启 动 系 统 2。注 册 键 会 在 协 调 器 磁 盘 中 丢 失如 果 协 调 器 磁 盘 丢 失 已 注 册 的 键 , 则 发 生 集 群 重 新 配 置 时 集 群 可 能 出 现 混 乱 。


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除157刷 新 丢 失 的 键◆使 用 vxfenswap 实 用 程 序 用 相 同 的 磁 盘 替 换 协 调 器 磁 盘 。vxfenswap 实 用 程 序会 注 册 在 磁 盘 替 换 过 程 中 丢 失 的 键 。集 群 脱 机 时 替 换 损 坏 的 磁 盘如 果 磁 盘 已 损 坏 或 无 法 运 行 , 且 您 希 望 切 换 到 脱 机 集 群 中 的 某 个 新 磁 盘 组 , 请 执 行以 下 过 程 。在 联 机 集 群 中 , 可 以 使 用 vxfenswap 实 用 程 序 替 换 这 些 磁 盘 。查 看 以 下 信 息 以 替 换 协 调 器 磁 盘 组 中 的 协 调 器 磁 盘 , 或 者 销 毁 协 调 器 磁 盘 组 。执 行 以 下 过 程 时 , 请 注 意 下 列 事 项 :■■添 加 磁 盘 时 , 请 将 磁 盘 添 加 到 磁 盘 组 vxfencoorddg, 然 后 重 新 测 试 该 组 是 否 支持 SCSI-3 持 久 性 保 留 。可 以 销 毁 协 调 器 磁 盘 组 , 以 便 磁 盘 中 不 再 保 留 任 何 注 册 键 。 然 后 , 该 磁 盘 可 另作 他 用 。集 群 脱 机 时 替 换 协 调 器 磁 盘 组 中 的 磁 盘1 以 超 级 用 户 身 份 登 录 到 其 中 一 个 集 群 节 点 上 。2 如 果 VCS 正 在 运 行 , 则 将 其 关 闭 :# hastop -all确 保 所 有 节 点 已 关 闭 端 口 h。 运 行 下 列 命 令 以 验 证 端 口 h 是 否 已 关 闭 :# gabconfig -a3 在 每 个 节 点 上 停 止 VCSMM 驱 动 程 序 :# /sbin/init.d/vcsmm stop4 停 止 每 个 节 点 上 的 I/O 防 护 :# /sbin/init.d/vxfen stop这 会 删 除 磁 盘 上 的 所 有 注 册 键 。


158VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除5 导 入 协 调 器 磁 盘 组 。/etc/vxfendg 文 件 中 包 括 磁 盘 组 的 名 称 ( 通 常 为vxfencoorddg), 该 磁 盘 组 包 含 协 调 器 磁 盘 , 因 此 请 使 用 以 下 命 令 :# vxdg -tfC import ‘cat /etc/vxfendg‘其 中 :-t 指 定 只 有 在 重 新 启 动 节 点 之 后 才 可 以 导 入 磁 盘 组 。-f 指 定 强 制 执 行 导 入 , 适 用 于 一 个 或 多 个 磁 盘 不 可 访 问 的 情 况 。-C 指 定 删 除 所 有 导 入 锁 。6 要 从 磁 盘 组 删 除 磁 盘 , 请 使 用 VxVM 磁 盘 管 理 员 实 用 程 序 vxdiskadm。您 还 可 以 销 毁 现 有 协 调 器 磁 盘 组 。 例 如 :■ 验 证 协 调 器 属 性 是 否 设 置 为 启 用 状 态 。# vxdg list vxfencoorddg | grep flags: | grep coordinator■ 销 毁 协 调 器 磁 盘 组 。# vxdg -o coordinator destroy vxfencoorddg7 向 节 点 添 加 新 磁 盘 并 将 其 初 始 化 为 VxVM 磁 盘 。然 后 , 将 新 磁 盘 添 加 到 vxfencoorddg 磁 盘 组 :■如 果 在 步 骤 6 中 销 毁 了 该 磁 盘 组 , 请 再 次 创 建 该 磁 盘 组 , 然 后 将 新 磁 盘 添加 到 其 中 。■ 如 果 该 磁 盘 组 已 经 存 在 , 请 将 新 磁 盘 添 加 到 其 中 。# vxdg -g vxfencoorddg -o coordinator adddisk disk_name8 测 试 重 新 创 建 的 磁 盘 组 是 否 符 合 SCSI-3 持 久 性 保 留 标 准 。9 替 换 了 协 调 器 磁 盘 组 中 的 磁 盘 之 后 , 逐 出 该 磁 盘 组 :# vxdg deport ‘cat /etc/vxfendg‘10 在 每 个 节 点 上 , 启 动 I/O 防 护 驱 动 程 序 :# /sbin/init.d/vxfen start11 在 每 个 节 点 上 , 启 动 VCSMM 驱 动 程 序 :# /sbin/init.d/vcsmm start


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除15912 验 证 I/O 防 护 模 块 是 否 已 启 动 并 且 已 启 用 。# gabconfig -a请 确 保 端 口 b 成 员 集 存 在 于 集 群 中 所 有 节 点 的 输 出 中 。请 确 保 端 口 b 和 端 口 o 成 员 集 存 在 于 集 群 中 所 有 节 点 的 输 出 中 。# vxfenadm -d请 确 保 在 输 出 中 未 禁 用 I/O 防 护 模 式 。13 如 有 必 要 , 在 每 个 节 点 上 重 新 启 动 VCS:# hastart如 果 rcp 命 令 或 scp 命 令 不 能 正 常 运 行 ,vxfenswap 实 用 程 序 会 退 出CP 服 务 器 故 障 排 除如 果 rcp 命 令 或 scp 命 令 不 能 正 常 运 行 , 则 vxfenswap 实 用 程 序 将 显 示 错 误 消 息 。恢 复 vxfenswap 实 用 程 序 故 障◆ 验 证 rcp 或 scp 是 否 正 常 运 行 。确 保 在 节 点 的 .bashrc 文 件 中 没 有 使 用 echo 或 cat 输 出 消 息 。如 果 vxfenswap 操 作 失 败 , 且 需 要 回 滚 该 实 用 程 序 所 做 的 任 何 更 改 , 请 使 用vxfenswap –a cancel 命 令 。所 有 CP 服 务 器 操 作 和 消 息 均 以 易 读 的 格 式 详 细 记 录 在 /var/VRTScps/log 目 录 下 的日 志 中 。 这 些 项 按 日 期 和 时 间 排 序 。 这 些 日 志 可 用 于 故 障 排 除 , 或 者 用 于 查 看 承 载CP 服 务 器 的 系 统 上 任 何 可 能 的 安 全 问 题 。下 列 文 件 包 含 可 能 有 助 于 了 解 CP 服 务 器 和 CP 服 务 器 排 除 故 障 的 日 志 和 文 本 文 件 :■/var/VRTScps/log/cpserver_[ABC].log■ /var/VRTSvcs/log/vcsauthserver.log( 与 安 全 相 关 )■ 如 果 CP 服 务 器 上 的 vxcpserv 进 程 失 败 , 则 请 查 看 下 列 诊 断 文 件 :■■/var/VRTScps/diag/FFDC_CPS_pid_vxcpserv.log/var/VRTScps/diag/stack_pid_vxcpserv.txt注 意 : 如 果 CP 服 务 器 上 的 vxcpserv 进 程 失 败 , 这 些 文 件 将 成 为 核 心 文 件 的 补充 。 在 这 种 情 况 下 ,VCS 会 自 动 重 新 启 动 vxcpserv 进 程 。


160VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除/var/VRTSvcs/log/vxfen/vxfend_[ABC].log 文 件 包 含 一 些 日 志 , 可 为 您 了 解 和 排查 VCS( 客 户 端 集 群 ) 节 点 上 与 防 护 相 关 的 问 题 提 供 帮 助 。请 参 见 第 160 页 的 “CP 服 务 器 服 务 组 相 关 问 题 故 障 排 除 ”。请 参 见 第 160 页 的 “ 检 查 CP 服 务 器 的 连 接 ”。请 参 见 第 161 页 的 “ 在 已 设 置 基 于 服 务 器 的 防 护 的 VCS 节 点 上 启 动 防 护 期 间 发 生 的 问题 ”。请 参 见 第 161 页 的 “ 协 调 点 联 机 迁 移 期 间 发 生 的 问 题 ”。CP 服 务 器 服 务 组 相 关 问 题 故 障 排 除如 果 在 CP 服 务 器 配 置 后 无 法 启 动 CPSSG 服 务 组 , 请 执 行 以 下 步 骤 :■ 验 证 CPSSG 服 务 组 及 其 资 源 是 否 有 效 以 及 是 否 在 VCS 配 置 中 正 确 配 置 。■检 查 VCS 引 擎 日 志 (/var/VRTSvcs/log/engine_[ABC].log) 以 查 看 是 否 有CPSSG 服 务 组 资 源 为 FAULTED 状 态 。■ 查 看 依 赖 关 系 图 示 例 以 确 保 正 确 配 置 所 需 的 资 源 。检 查 CP 服 务 器 的 连 接可 以 使 用 cpsadm 命 令 测 试 CP 服 务 器 的 连 接 性 。只 有 设 置 了 环 境 变 量 CPS_USERNAME 和 CPS_DOMAINTYPE, 才 能 在 VCS( 客 户端 集 群 ) 节 点 上 运 行 cpsadm 命 令 。检 查 CP 服 务 器 的 连 接◆ 运 行 以 下 命 令 以 检 查 CP 服 务 器 是 否 已 启 动 并 在 进 程 级 别 上 运 行 :# cpsadm -s cp_server -a ping_cps其 中 ,cp_server 是 CP 服 务 器 正 在 监 听 的 虚 拟 IP 地 址 或 虚 拟 主 机 名 。SFHA Solutions 集 群 节 点 上 基 于 服 务 器 的 防 护 的 故 障 排 除/var/VRTSvcs/log/vxfen/vxfend_[ABC].log 文 件 包 含 一 些 日 志 , 可 为 您 了 解 和 排查 SFHA Solutions 集 群 ( 应 用 集 群 ) 节 点 上 与 防 护 相 关 的 问 题 提 供 帮 助 。


VCS 的 故 障 排 除 与 恢 复I/O 防 护 故 障 排 除161在 已 设 置 基 于 服 务 器 的 防 护 的 VCS 节 点 上 启 动 防 护 期 间 发 生 的问 题表 14-5VCS( 客 户 端 集 群 ) 节 点 上 的 防 护 启 动 问 题问 题在 VCS 上 使 用 cpsadm命 令 会 导 致 连 接 错 误授 权 故 障说 明 和 解 决 方 案如 果 在 VCS 上 发 出 cpsadm 命 令 后 收 到 连 接 错 误 消 息 , 请 执 行 以 下 操 作 :■ 确 保 CP 服 务 器 可 从 所 有 的 VCS 节 点 进 行 访 问 。■ 检 查 VCS 节 点 使 用 的 CP 服 务 器 虚 拟 IP 或 虚 拟 主 机 名 以 及 端 口 号 是 否 正 确 。检 查 /etc/vxfenmode 文 件 。■ 确 保 正 在 运 行 的 CP 服 务 器 使 用 的 是 相 同 的 虚 拟 IP/ 虚 拟 主 机 名 和 端 口 号 。如 果 未 在 CP 服 务 器 配 置 中 添 加 CP 服 务 器 的 节 点 或 用 户 , 会 出 现 授 权 故 障 , 从 而 不 允 许 VCS( 客 户 端 集 群 ) 节 点 上 的 防 护 访 问 CP 服 务 器 以 及 在 CP 服 务 器 上 注 册 自 身 。 如 果 向 大 多 数协 调 点 注 册 失 败 , 将 无 法 启 动 防 护 。要 解 决 此 问 题 , 请 在 CP 服 务 器 配 置 中 添 加 CP 服 务 器 节 点 和 用 户 , 然 后 重 新 启 动 防 护 。身 份 验 证 故 障如 果 已 在 CP 服 务 器 和 VCS( 客 户 端 集 群 ) 节 点 之 间 配 置 了 安 全 通 信 , 以 下 原 因 可 能 会 导 致身 份 验 证 错 误 :■未 在 CP 服 务 器 和 / 或 VCS 上 正 确 配 置 <strong>Symantec</strong> Product Authentication Services (AT)。■ CP 服 务 器 和 VCS 节 点 使 用 不 同 的 根 代 理 , 并 且 未 在 身 份 验 证 代 理 之 间 建 立 信 任 :协 调 点 联 机 迁 移 期 间 发 生 的 问 题在 使 用 vxfenswap 实 用 程 序 进 行 协 调 点 联 机 迁 移 期 间 , 如 果 在 验 证 任 意 集 群 节 点 中的 协 调 点 期 间 遇 到 故 障 , 则 操 作 会 自 动 回 滚 。在 以 下 情 况 中 可 能 会 发 生 新 协 调 点 组 验 证 故 障 :■■未 在 所 有 VCS 节 点 上 更 新 /etc/vxfenmode.test 文 件 , 因 为 节 点 上 的 新 协 调 点 是从 旧 的 /etc/vxfenmode.test 文 件 中 取 得 的 。 必 须 使 用 当 前 详 细 信 息 更 新/etc/vxfenmode.test 文 件 。 如 果 /etc/vxfenmode.test 文 件 不 存 在 ,vxfenswap将 从 /etc/vxfenmode 文 件 中 复 制 新 协 调 点 的 配 置 。不 同 VCS 节 点 上 的 /etc/vxfenmode 文 件 中 列 出 的 协 调 点 不 相 同 。 如 果 在 集 群 节点 上 的 /etc/vxfenmode 文 件 中 列 出 了 不 同 的 协 调 点 , 则 会 由 于 在 协 调 点 快 照 检查 期 间 发 生 故 障 而 导 致 操 作 失 败 。■ 没 有 从 一 个 或 多 个 VCS 节 点 到 CP 服 务 器 的 网 络 连 接 。■ 尚 未 在 新 CP 服 务 器 上 添 加 集 群 、 节 点 或 VCS 节 点 的 用 户 , 从 而 导 致 授 权 故 障 。


162VCS 的 故 障 排 除 与 恢 复疑 难 解 答 通 知疑 难 解 答 通 知在 发 出 vxfenswap 命 令 后 进 行 Vxfen 服 务 组 活 动协 调 点 代 理 从 vxfenconfig -l 输 出 中 读 取 协 调 点 详 细 信 息 , 并 开 始 监 视 这 些 协 调点 上 的 注 册 内 容 。因 此 , 在 执 行 vxfenswap 命 令 期 间 , 如 果 用 户 正 在 更 改 vxfenmode 文 件 , 则 协 调点 代 理 不 会 变 为 FAULTED 状 态 , 而 是 继 续 监 视 旧 的 协 调 点 组 。只 要 未 提 交 对 vxfenmode 文 件 的 更 改 , 或 者 未 在 vxfenconfig -l 输 出 中 反 映 出 新协 调 点 集 , 协 调 点 代 理 就 会 继 续 监 视 在 每 个 监 视 周 期 从 vxfenconfig -l 输 出 中 读取 的 旧 协 调 点 集 。协 调 点 代 理 的 状 态 (ONLINE 或 者 FAULTED) 根 据 协 调 点 的 可 访 问 性 、 这 些 协 调点 上 的 注 册 以 及 容 错 值 而 定 。在 提 交 对 vxfenmode 文 件 的 更 改 并 反 映 在 vxfenconfig -l 输 出 中 后 , 协 调 点 代 理会 读 取 新 协 调 点 集 , 并 继 续 在 新 监 视 周 期 内 对 其 进 行 监 视 。有 时 , 您 可 能 会 在 使 用 VCS 通 知 时 遇 到 问 题 。 本 节 介 绍 最 常 见 的 问 题 和 建 议 的 操作 。 粗 体 文 本 提 供 问 题 的 说 明 。已 配 置 通 知 程 序 , 但 在 SNMP 控 制 台 上 看 不 到 陷 阱建 议 的 操 作 : 验 证 控 制 台 所 支 持 的 SNMP 陷 阱 的 版 本 : VCS 通 知 程 序 发 送 SNMPv2.0 陷 阱 。 如 果 您 将 HP OpenView Network Node Manager 用 作 SNMP, 请 验 证已 使 用 xnmevents 配 置 了 VCS 事 件 。 合 并 vcs_trapd 中 的 VCS 事 件 后 , 如 果 这 些事 件 未 在 OpenView Network Node Manager Event 配 置 中 列 出 , 您 还 可 以 尝 试 重新 启 动 OpenView 后 台 驻 留 程 序 (ovw)。默 认 情 况 下 , 通 知 程 序 假 定 团 体 字 符 串 是 公 共 的 。 如 果 您 的 SNMP 控 制 台 是 使 用其 他 团 体 配 置 的 , 则 根 据 通 知 程 序 配 置 重 新 配 置 它 。 有 关 NotifierMngr 的 更 多 信息 , 请 参 见 《<strong>Veritas</strong> Cluster Server Bundled Agents 参 考 指 南 》。全 局 集 群 的 故 障 排 除 与 恢 复本 主 题 介 绍 灾 难 声 明 的 概 念 , 并 提 供 对 使 用 全 局 集 群 的 配 置 的 故 障 排 除 提 示 。灾 难 声 明全 局 集 群 中 的 某 个 集 群 转 换 为 FAULTED 状 态 时 , 由 于 无 法 再 访 问 该 集 群 , 所 以 将根 据 导 致 故 障 的 原 因 是 远 程 集 群 出 现 裂 脑 、 临 时 中 断 还 是 永 久 灾 难 来 执 行 故 障 转移 。如 果 您 选 择 对 全 局 集 群 中 的 集 群 故 障 采 取 措 施 , 则 VCS 会 提 示 您 声 明 故 障 的 类 型 。


VCS 的 故 障 排 除 与 恢 复全 局 集 群 的 故 障 排 除 与 恢 复163■ Disaster ( 灾 难 ), 表 示 主 数 据 中 心 永 久 丢 失■■Outage ( 中 断 ), 表 示 主 数 据 中 心 可 能 在 某 些 时 间 会 返 回 到 其 当 前 形 态Disconnect ( 断 开 ), 表 示 裂 脑 情 况 ; 两 个 集 群 已 启 动 , 但 它 们 之 间 的 链 接 已 断 开■ Replica ( 副 本 ), 表 示 接 管 目 标 上 的 数 据 已 与 备 份 源 一 致 , 当 服 务 组 联 机 后 ,RVGPrimary 可 以 启 动 接 管 。 此 选 项 只 适 用 于 VVR 环 境 。可 以 选 择 要 故 障 转 移 到 本 地 集 群 的 组 , 在 这 种 情 况 下 ,VCS 将 根 据 所 选 组 的FailOverPolicy 属 性 使 组 在 节 点 上 联 机 。 它 还 在 其 他 集 群 中 将 这 些 组 标 记 为OFFLINE。 如 果 您 未 选 择 任 何 要 进 行 故 障 转 移 的 服 务 组 , 则 VCS 除 在 关 闭 的 集 群上 隐 式 地 将 服 务 组 标 记 为 脱 机 外 , 不 会 采 取 任 何 措 施 。丢 失 的 心 跳 和 查 询 机 制任 意 两 个 集 群 之 间 的 内 部 心 跳 和 所 有 外 部 心 跳 丢 失 表 明 远 程 集 群 出 现 故 障 , 或 者 两个 集 群 之 间 的 所 有 通 信 链 路 已 断 开 ( 广 域 裂 脑 )。VCS 查 询 集 群 以 便 确 认 已 丢 失 其 心 跳 的 远 程 集 群 是 否 已 真 正 关 闭 。 这 种 机 制 被 称 为查 询 。 在 双 集 群 配 置 中 , 如 果 一 个 连 接 器 丢 失 了 与 另 一 个 连 接 器 的 所 有 心 跳 , 则 肯定 是 远 程 集 群 出 现 了 故 障 。 如 果 有 两 个 以 上 的 集 群 , 并 且 一 个 连 接 器 丢 失 了 与 另 一个 集 群 所 有 心 跳 , 则 它 会 在 声 明 该 集 群 出 现 故 障 之 前 查 询 剩 余 连 接 器 。 如 果 其 他 连接 器 将 该 集 群 视 为 处 于 运 行 状 态 , 则 进 行 查 询 的 连 接 器 会 将 该 集 群 转 换 为 UNKNOWN状 态 , 此 过 程 会 最 大 程 度 地 减 少 假 集 群 故 障 。 如 果 所 有 连 接 器 均 报 告 该 集 群 出 现 故障 , 则 进 行 查 询 的 连 接 器 也 将 该 集 群 视 为 出 现 故 障 , 并 将 远 程 集 群 状 态 转 换 为FAULTED。VCS 警 报VCS 警 报 由 警 报 ID 标 识 , 警 报 ID 由 以 下 元 素 组 成 :■alert_type - 警 报 类 型■■cluster - 在 其 上 生 成 警 报 的 集 群system - 在 其 上 生 成 警 报 的 系 统■ object - 为 其 生 成 警 报 的 VCS 对 象 的 名 称 。 此 对 象 可 以 是 集 群 或 服 务 组 。按 以 下 格 式 生 成 警 报 :alert_type-cluster-system-object例 如 :GNOFAILA-Cluster1-oracle_grp这 是 在 集 群 Cluster1 上 为 服 务 组 oracle_grp 生 成 的 GNOFAILA 类 型 的 警 报 。


164VCS 的 故 障 排 除 与 恢 复全 局 集 群 的 故 障 排 除 与 恢 复警 报 类 型VCS 可 生 成 下 列 类 型 的 警 报 。■■CFAULT - 表 明 集 群 已 出 现 故 障GNOFAILA - 表 明 全 局 组 无 法 在 其 处 于 联 机 状 态 的 集 群 内 进 行 故 障 转 移 。 如 果 将ClusterFailOverPolicy 属 性 设 置 为 “Manual ( 手 动 )”, 并 且 广 域 连 接 器 (wac)已 进 行 正 确 配 置 且 在 出 现 故 障 时 正 在 运 行 , 则 会 显 示 此 警 报 。■ GNOFAIL - 表 明 全 局 组 无 法 在 集 群 或 远 程 集 群 内 故 障 转 移 到 任 何 系 统 。全 局 组 可 能 无 法 故 障 转 移 到 远 程 集 群 的 一 些 原 因 如 下 :■■■ClusterFailOverPolicy 设 置 为 “Auto ( 自 动 )” 或 “Connected ( 连 接 )”, 且VCS 无 法 确 定 将 该 组 自 动 故 障 转 移 到 的 有 效 远 程 集 群 。ClusterFailOverPolicy 属 性 设 置 为 “Connected ( 连 接 )”, 并 且 组 出 现 故 障的 集 群 无 法 与 该 组 ClusterList 中 列 出 的 一 个 或 多 个 远 程 集 群 通 信 。广 域 连 接 器 (wac) 未 处 于 联 机 状 态 , 或 在 组 出 现 故 障 的 集 群 中 未 进 行 正 确 配置 。管 理 警 报警 报 需 要 用 户 干 预 。 您 可 以 按 下 列 方 式 响 应 警 报 :■如 果 可 以 忽 略 警 报 的 原 因 , 则 使 用 Java 控 制 台 中 的 “Alerts ( 警 报 )” 对 话 框 或haalert 命 令 删 除 警 报 。 您 必 须 提 供 关 于 删 除 警 报 原 由 的 注 释 ;VCS 会 将 此 注释 记 录 到 引 擎 日 志 中 。■ 对 具 有 相 关 操 作 的 管 理 警 报 采 取 相 应 的 操 作 。■ 当 发 生 警 报 的 取 消 事 件 时 ,VCS 将 删 除 或 取 消 某 些 警 报 。如 果 未 执 行 上 述 任 何 操 作 , 并 且 VCS 引 擎 (HAD) 正 在 集 群 中 的 至 少 一 个 节 点 上 运行 , 则 管 理 警 报 将 继 续 存 在 。 如 果 HAD 未 在 集 群 中 的 任 何 节 点 上 运 行 , 则 管 理 警报 将 丢 失 。与 警 报 相 关 的 操 作本 节 介 绍 可 以 对 下 列 类 型 的 警 报 执 行 的 操 作 :■■■CFAULT - 出 现 此 警 报 时 , 单 击 “Take Action ( 采 取 操 作 )” 可 指 导 您 完 成 对 全局 组 ( 全 局 组 在 集 群 出 现 故 障 前 在 集 群 中 处 于 联 机 状 态 ) 进 行 故 障 转 移 的 过 程 。GNOFAILA - 出 现 此 警 报 时 , 单 击 “Take Action ( 采 取 操 作 )” 可 指 导 您 完 成 将全 局 组 故 障 转 移 到 远 程 集 群 ( 全 局 组 在 该 远 程 集 群 中 配 置 为 运 行 ) 的 过 程 。GNOFAIL - 控 制 台 没 有 为 此 警 报 提 供 相 关 操 作


VCS 的 故 障 排 除 与 恢 复对 steward 进 程 进 行 故 障 排 除165取 消 事 件当 出 现 故 障 的 集 群 返 回 到 运 行 状 态 时 ,VCS 将 删 除 CFAULT 警 报 。VCS 将 删 除 GNOFAILA 和 GNOFAIL 警 报 以 响 应 下 列 事 件 :■ 出 现 故 障 的 组 的 状 态 由 FAULTED 更 改 为 ONLINE。■ 组 的 故 障 已 清 除 。■ 已 从 生 成 警 报 的 集 群 中 删 除 组 。启 动 时 发 生 并 发 冲 突当 您 将 集 群 添 加 到 服 务 组 的 ClusterList 中 时 ,VCS 可 能 报 告 并 发 冲 突 。 并 发 冲 突意 味 着 服 务 组 同 时 在 两 个 节 点 上 联 机 。建 议 的 操 作 : 使 服 务 组 成 为 全 局 服 务 组 之 前 , 验 证 该 服 务 组 在 每 个 集 群 中 的 状 态 。对 steward 进 程 进 行 故 障 排 除启 动 steward 时 , 它 会 阻 止 命 令 提 示 符 并 将 消 息 输 出 到 标 准 输 出 。 要 停 止 steward,请 从 同 一 系 统 中 的 不 同 命 令 提 示 符 运 行 以 下 命 令 :如 果 steward 以 安 全 模 式 运 行 :steward -stop -secure如 果 steward 不 是 以 安 全 模 式 运 行 :steward -stop除 标 准 输 出 之 外 ,steward 可 以 将 日 志 记 录 到 它 自 己 的 日 志 文 件 :■■steward_A.logsteward-err_A.log使 用 tststew 实 用 程 序 验 证 :■■steward 进 程 正 在 运 行steward 进 程 正 在 发 送 正 确 的 响 应授 权 许 可 故 障 排 除本 节 介 绍 您 可 能 遇 到 的 VCS 授 权 问 题 。 本 节 提 供 有 关 如 何 验 证 许 可 证 密 钥 的 说 明 ,并 列 出 与 授 权 相 关 的 错 误 消 息 。


166VCS 的 故 障 排 除 与 恢 复授 权 许 可 故 障 排 除验 证 许 可 证 密 钥installvcs 脚 本 可 处 理 大 多 数 许 可 证 密 钥 验 证 。 但 是 , 如 果 您 使 用 installvcs 之外 的 命 令 ( 例 如 , 使 用 vxlicinst) 安 装 VCS 密 钥 , 则 可 以 使 用 下 面 介 绍 的 过 程 验证 密 钥 。1 vxlicinst 命 令 可 处 理 一 些 基 本 验 证 :节 点 锁 定 : 确 保 您 将 节 点 锁 定 的 密 钥 安 装 在 正 确 的 系 统 上演 示 硬 结 束 日 期 : 确 保 您 安 装 的 不 是 过 期 的 演 示 密 钥2 运 行 vxlicrep 命 令 以 确 保 系 统 上 已 安 装 VCS 密 钥 。 该 命 令 的 输 出 如 下 所 示 :License Key = XXXX-XXXX-XXXX-XXXX-XXXX-XXXXProduct Name = <strong>Veritas</strong> Cluster ServerLicense Type = PERMANENTOEM ID = 4095Features :Platform= HP-UXVersion = 6.0Tier= UnusedReserved = 0Mode= VCSGlobal Cluster Option = Enabled3 在 命 令 输 出 中 查 找 以 下 内 容 :确 保 Product Name 中 列 出 您 购 买 的 组 件 的 名 称 , 例 如 <strong>Veritas</strong> Cluster Server。如 果 命 令 输 出 中 未 返 回 产 品 名 称 , 则 说 明 您 没 有 安 装 VCS 密 钥 。如 果 输 出 中 将 VCS 密 钥 的 许 可 证 类 型 显 示 为 DEMO, 请 确 保 Demo End Date显 示 的 不 是 过 去 的 日 期 。确 保 Mode 属 性 显 示 正 确 的 值 。如 果 您 已 购 买 Global Cluster Option 的 许 可 证 密 钥 , 请 确 保 其 状 态 为 Enabled。4 启 动 VCS。 如 果 HAD 拒 绝 许 可 证 密 钥 , 请 参 见 engine_A 日 志 文 件 末 尾 的 授 权错 误 消 息 。授 权 错 误 消 息本 节 列 出 了 与 授 权 相 关 的 错 误 消 息 。 这 些 消 息 记 录 在/var/VRTSvcs/log/engine_A.log 文 件 中 。


VCS 的 故 障 排 除 与 恢 复授 权 许 可 故 障 排 除167[Licensing] Insufficient memory to perform operation ([ 授 权 ] 内存 不 足 , 无 法 执 行 操 作 )系 统 没 有 足 够 的 资 源 来 执 行 授 权 操 作 。[Licensing] No valid VCS license keys were found ([ 授 权 ] 找 不 到有 效 的 VCS 许 可 证 密 钥 )在 系 统 上 找 不 到 有 效 的 VCS 密 钥 。[Licensing] Unable to find a valid base VCS license key ([ 授 权 ]找 不 到 有 效 的 基 本 VCS 许 可 证 密 钥 )在 系 统 上 找 不 到 有 效 的 基 本 VCS 密 钥 。[Licensing] License key cannot be used on this OS platform ([ 授权 ] 无 法 在 此 操 作 系 统 平 台 上 使 用 该 许 可 证 密 钥 )此 消 息 表 明 该 许 可 证 密 钥 适 用 于 其 他 平 台 。 例 如 , 适 用 于 Windows 的 许 可 证 密 钥用 在 了 HP-UX 平 台 上 。[Licensing] VCS evaluation period has expired ([ 授 权 ] VCS 评 估期 已 过 )VCS 评 估 版 已 过 期 。[Licensing] License key can not be used on this system ([ 授 权 ]无 法 在 此 系 统 上 使 用 该 许 可 证 密 钥 )表 明 您 安 装 了 一 个 适 用 于 其 他 系 统 的 密 钥 ( 即 节 点 锁 定 的 密 钥 )。[Licensing] Unable to initialize the licensing framework ([ 授 权 ]无 法 初 始 化 该 授 权 框 架 )这 是 一 个 VCS 内 部 消 息 。 请 致 电 <strong>Veritas</strong> 技 术 支 持 。[Licensing] QuickStart is not supported in this release ([ 授 权 ]此 版 本 不 支 持 QuickStart)此 版 本 的 VCS 不 支 持 VCS QuickStart。


168VCS 的 故 障 排 除 与 恢 复授 权 许 可 故 障 排 除[Licensing] Your evaluation period for the feature hasexpired.This feature will not be enabled the next time VCS starts([ 授 权 ] 该 功 能 的 评 估 期 已 过 。VCS 下 次 启 动 后 该 功 能 将 处 于 禁用 状 态 )指 定 的 VCS 功 能 的 评 估 版 已 过 期 。


索 引符 号.cmdlog 文 件 61.translog 文 件 63/etc/vx/cbr/bk/diskgroup.dgiddgid .binconfig 文 件 71dgid .cfgrec 文 件 71dgid .diskinfo 文 件 70dgid.dginfo 文 件 70/etc/vx/log 日 志 记 录 目 录 61, 63/sbin/init.d/vxvm-sysboot 文 件 82/st<strong>and</strong>/rootconf 文 件 58/var/adm/vxconfigd.log 文 件 81/var/log/syslog/syslog.log 文 件 82AACTIVE Plex 状 态 25ACTIVE 卷 状 态 34BBADLOG Plex 状 态 34badlog 标 志DCO 清 除 42备 份主 节 点 存 储 检 查 点 103C重 新 启 动 禁 用 的 卷 29失 效 子 磁 盘 33重 新 挂 接 磁 盘 31RAID-5 奇 偶 校 验 35CLEAN Plex 状 态 25cmdlog 文 件 61磁 盘failing 标 志 30故 障 33故 障 原 因 23重 新 挂 接 31重 新 挂 接 出 错 的 31磁 盘 组备 份 配 置 69–70还 原 配 置 69, 71解 决 备 份 冲 突 73配 置 备 份 文 件 70移 动 失 败 后 恢 复拆 分 或 结 合 40存 储 检 查 点数 据 卷 错 误恢 复 使 用 103清 除 使 用 103错 误初 次 RLINK 挂 接 期 间 90名 称 不 匹 配数 据 卷 94–95配 置 90缺 少 数 据 卷 93数 据 卷 大 小 不 匹 配 94–95修 改 RVG 期 间 93错 误 消 息 84RAID-5 Plex 未 映 射 整 个 卷 长 38vxconfigd -m 引 导 返 回 错 误 57磁 盘 组 不 存 在 40代 理 日 志 125记 录 81卷 不 可 启 动 38卷 的 同 步 由 于 I/O 错 误 而 停 止 50没 有 加 载 volboot 文 件 57默 认 日 志 文 件 81某 些 子 磁 盘 不 可 用 且 奇 偶 校 验 失 效 38启 动 脚 本 82启 动 时 139启 用 失 败 57事 务 处 理 被 禁 用 57无 法 自 动 导 入 组 69消 息 目 录 132因 发 生 错 误 而 禁 用 69引 导 期 间 不 能 导 入 Rootdg 57引 擎 日 志 125有 两 个 磁 盘 组 名 称 相 同 而 磁 盘 组 ID 不 同 的 备 份 73


170索 引DDCO恢 复 卷 40删 除 badlog 标 志 42DCO 卷I/O 故 障 后 恢 复 51DEGRADED 卷 状 态 33DETACHED 卷 内 核 状 态 34DISABLED Plex 内 核 状 态 25, 34代 理 日 志格 式 125位 置 125调 试 消 息记 录 81EEMPTY Plex 状 态 25ENABLED Plex 内 核 状 态 25ENABLED 卷 内 核 状 态 34二 进 制 消 息 目 录关 于 132位 置 132Ffailing 标 志清 除 30防 护 配 置故 障 排 除 117辅 助 节 点 SRL卷 错 误 104头 错 误 104辅 助 节 点 存 储 检 查 点恢 复 使 用 103G告 急 消 息 84根 磁 盘恢 复 53根 文 件 系 统损 坏 59故 障磁 盘 33系 统 32故 障 排 除CVMVolDg 121VCS 启 动 139防 护 配 置 117日 志 记 录 125无 法 导 入 共 享 磁 盘 组 120许 可 证 密 钥 165主 题 概 述 115, 119HHAD 诊 断 133hpux -vm用 于 进 入 MMB 引 导 58恢 复磁 盘 31从 恢 复 介 质 引 导 后 56在 VxVM 紧 急 启 动 后 57恢 复 介 质 55II/O 防 护测 试 和 情 形 149inode 列 表 错 误 19IOFAIL Plex 状 态 25J记 录 调 试 错 误 消 息 81紧 急 启 动 56进 程 ID在 命 令 日 志 记 录 文 件 中 61在 事 务 日 志 记 录 文 件 中 63禁 用 的 文 件 系 统事 务 处 理 19警 告 消 息 84镜 像 卷恢 复 28卷DCO 恢 复 40RAID-5 数 据 丢 失 32恢 复 RAID-5 35恢 复 镜 像 28列 出 不 可 启 动 的 24失 效 的 子 磁 盘启 动 39显 示 状 态 24重 新 启 动 禁 用 的 29卷 内 核 状 态DETACHED 34启 用 34卷 状 态DEGRADED 33NEEDSYNC 35REPLAY 34


索 引171SYNC 34–35主 动 34K客 户 端 ID在 命 令 日 志 记 录 文 件 中 61在 事 务 日 志 记 录 文 件 中 63快 照 重 新 同 步错 误 后 恢 复 50LLOG Plex 状 态 34列 表不 可 启 动 的 卷 24MMMB引 导 到 58MOVE 标 志设 置 于 TUTIL0 字 段 中 40msgcnt 字 段 20命 令日 志 记 录 61与 事 务 关 联 64NNEEDSYNC 卷 状 态 35notificationtroubleshooting 162Pparity( 奇 偶 校 验 )失 效 32plex恢 复 镜 像 卷 28Plex为 RECOVER 状 态 28显 示 状 态 24已 定 义 25映 射 问 题 38Plex 内 核 状 态DISABLED 25ENABLED 25禁 用 34plex 状 态STALE 28Plex 状 态ACTIVE 25BADLOG 34CLEAN 25EMPTY 25IOFAIL 25LOG 34配 置备 份 文 件 70解 决 备 份 冲 突 73为 磁 盘 组 备 份 69为 磁 盘 组 还 原 69针 对 磁 盘 组 进 行 备 份 70针 对 磁 盘 组 进 行 还 原 71配 置 错 误恢 复 90Q奇 偶 校 验对 RAID-5 的 重 新 同 步 35重 建 检 查 点 设 置 35全 局 消 息 ID 20缺 少 数 据 卷 错 误 93RRAID-5不 可 启 动 的 卷 38分 离 子 磁 盘 33故 障 32恢 复 过 程 34恢 复 卷 35恢 复 日 志 Plex 36奇 偶 校 验 重 新 同 步 35启 动 恢 复 过 程 34启 动 卷 38强 制 启 动 39热 重 定 位 35日 志 Plex 的 重 要 性 32失 效 的 奇 偶 校 验 32子 磁 盘 移 动 恢 复 37RECOVER 状 态 28REPLAY 卷 状 态 34resourcestroubleshooting 145RLINKSTALE 101rootvol恢 复 57


172索 引RVG关 联 以 清 除 PASSTHRU 100热 重 定 位RAID-5 35已 定 义 23日 志 Plex对 于 RAID-5 的 重 要 性 32恢 复 RAID-5 36日 志 故 障 19日 志 记 录代 理 日 志 125关 联 命 令 和 事 务 64目 录 61, 63消 息 标 记 125引 擎 日 志 125日 志 文 件 159syslog 错 误 消 息 82vxconfigd 81默 认 81Ssecondary_log_err 标 志 104secondary_paused 标 志 104service groupstroubleshooting 142SRL 头 错 误 102SRL 溢 出 保 护防 止 101SYNC 卷 状 态 34–35syslog错 误 日 志 文 件 82失 效 的 奇 偶 校 验 32事 务日 志 记 录 63与 命 令 关 联 64事 务 处 理 禁 用 19数 据 丢 失RAID-5 32数 据 卷 错 误调 整 大 小 94名 称 不 匹 配 94缺 少 93数 据 卷 大 小调 整 大 小 95Ttranslog 文 件 63troubleshootingnotification 162resources 145service groups 142TUTIL0 字 段清 除 MOVE 标 志 40通 知 消 息 84退 化 模 式RAID-5 33Uunmount 20VV-5-1-123 69V-5-1-1236 38V-5-1-1237 38V-5-1-2907 40V-5-1-569 69V-5-1-6012 73V-5-1-6840 50VCStroubleshooting resources 145troubleshooting service groups 142日 志 记 录 125vx_emerg_start针 对 恢 复 启 动 VxVM 56VX_FULLFSCK 19vxcmdlog控 制 命 令 日 志 记 录 61vxconfigbackup备 份 磁 盘 组 配 置 70vxconfigd日 志 文 件 81vxconfigd.log 文 件 81vxconfigrestore还 原 磁 盘 组 配 置 71vxdco从 DCO 中 删 除 badlog 标 志 42vxdctl更 改 调 试 日 志 记 录 的 级 别 81vxdg磁 盘 组 移 动 失 败 后 恢 复拆 分 或 结 合 40vxedit清 除 磁 盘 failing 标 志 30


索 引173vxedit 命 令rename 关 键 字在 RLINK 恢 复 期 间 对 卷 进 行 重 命 名 92vxinfo 命 令 24vxmend 命 令 28vxplex 命 令 36vxprint显 示 卷 和 Plex 状 态 24vxreattach重 新 挂 接 出 错 的 磁 盘 31vxsnap make故 障 后 恢 复 48vxsnap prepare故 障 后 恢 复 47vxsnap refresh失 败 后 恢 复 49vxsnap restore失 败 后 恢 复 49vxtranslog控 制 事 务 日 志 记 录 63VxVMRAID-5 恢 复 过 程 34从 恢 复 介 质 引 导 后 启 动 56紧 急 启 动 56使 用 维 护 模 式 引 导 (MMB) 58vxvol recover 命 令 37vxvol resync 命 令 35vxvol start 命 令 28vxvol 命 令aslog 关 键 字关 联 SRL 100assoc 关 键 字关 联 新 卷 92dis 关 键 字分 离 SRL 100start 关 键 字启 动 SRL 100启 动 数 据 卷 98W维 护 模 式 引 导 (MMB)引 导 到 58文 件磁 盘 组 配 置 备 份 70系 统 故 障 32消 息 标 记关 于 125写 入 时 复 制故 障 后 恢 复 50信 息 性 消 息 84许 可 证 密 钥故 障 排 除 165Y已 分 离 的 RAID-5 日 志 Plex 36引 导到 维 护 模 式 58引 导 磁 盘恢 复 53引 擎 日 志格 式 125位 置 125硬 件 故 障恢 复 23Z致 命 错 误 消 息 84重 新 安 装 整 个 系 统 59主 节 点 SRL错 误清 除 100头 错 误 101溢 出 恢 复 101主 节 点 存 储 检 查 点清 除 使 用 103主 节 点 主 机故 障 恢 复 97状 态显 示 卷 和 Plex 24子 磁 盘RAID-5 移 动 后 恢 复 37标 记 为 未 失 效 39失 效启 动 卷 39X系 统重 新 安 装 59

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!