恢复横幅数据库

横幅数据库恢复过程

奥克兰大学技术服务的使命声明强调,我们致力于维护一万博ManBetX登录个“总是”“值得信赖”的计算环境。系统故障是不可预知的,拥有良好的备份和恢复过程是确保我们的系统的一个重要组成部分,当他们经历失败,可以快速恢复服务用最少的数据丢失。

万博ManBetX登录奥克兰大学目前有两种不同的流程来支持灾难恢复横幅数据库:

  • 物理备用数据库——这是数据库的一个副本运行在另一个数据库服务器。横幅刺激,ea-banproddb-p01主数据库服务器。sys ea-banproddb-p02.sys备用服务器。定期(大约每30分钟,或更多的重更新活动),在主数据库上执行一个重做日志开关,这使日志文件被传递到备用数据库服务器和应用。脚本运行在主数据库服务器每小时提醒备用数据库时数据库管理员太远远跟不上主。
  • 甲骨文RMAN备份——在主服务器和备用数据库服务器脚本/home/oracle/oakdba/rman_backups / rman_backup。shl将通过运行oracle用户crontab。备份当前运行在以下安排:
    • 测试
      • 周日凌晨一点- 0级备份(全)
      • Monday-Saturday至凌晨1点,1级备份(增量)
    • AMTST8
      • 周日的凌晨3:00——0级备份(全)
      • Monday-Saturday凌晨3:00 - 1级备份(增量)
    • EMOMS
      • 周日凌晨3:30——0级备份(全)
      • Monday-Saturday凌晨3:30 - 1级备份(增量)
    • dwt
      • 周日下午四点——0级备份(全)
      • Monday-Saturday下午四点- 1级备份(增量)
    • 刺激
      • 当前增量运行每日凌晨2点开始,取而代之的是增量备份策略
    • AMPROD
      • 当前增量运行每日凌晨2点开始,取而代之的是增量备份策略
    • DWPROD
      • 当前增量运行每日凌晨2点开始,取而代之的是增量备份策略
    • ODS
      • 需要更多的信息

这些备份文件保存在服务器上备份,位于文件系统不同于那些存储数据文件来完成。Veeam过程由TSS复制备份文件备份服务器。

增量备份,恢复窗口RMAN备份是8天。增量备份,恢复窗口2天。查看所有RMAN政策数据库可以执行以下操作:

  1. 与ORACLE_SID oracle用户,设置为所需的数据库,输入“rman目标/”。
    1. 在RMAN提示,输入“显示所有;”

请注意:RMAN政策是特定于每个数据库。

的灾难性故障的主要横幅数据库服务器,可以使用本文档中描述的过程来恢复横幅数据库服务在一个合理的时间框架。

失败不需要故障转移或媒体恢复

一些系统故障,虽然不方便,不是严重到发起一个漫长的恢复过程。这种失败的例子可能是:

  • 短暂的停电
  • CPU故障
  • 内存失败
  • 短暂的网络故障
  • 操作系统崩溃

在这种情况下,只要没有损坏磁盘存储系统和系统可以立即重启,可能不需要启动数据库故障转移或恢复的文件。Oracle数据库重启时,他们将执行实例恢复联机重做日志,以便所有已提交的事务的失败被写到磁盘之前,和操作可能会继续从这一点。

物理备用数据库

Oracle数据警卫队用于维护物理备用数据库对所有生产和非ODS测试数据库。这些数据库是不能用于正常使用而主数据库是活跃的。然而,如果在主服务器上有一个中断服务(如长时间的停电或网络故障道奇厅数据中心),备用数据库可以假设主要数据库的角色在几分钟内没有提交的数据损失,只要任何可能发生的物理数据腐败主数据库服务器上没有传输到备用。

归档重做日志是网络对面的主要运往定期备用数据库和应用。这些日志应用大约每30分钟,或者更多,这取决于数量的更新活动在主节点上发生。数据库管理员监控定期归档重做日志应用程序进程,以确认它是正常运作。

转让和归档重做日志的应用可能会破坏如果有备用服务器上的物理磁盘空间短缺,或如果空间留给recovery-related文件(使用db_recovery_file_dest_size备用服务器中配置)变得疲惫不堪。这种情况应该尽快由数据库管理员解决。有几种方法可以用来纠正这种条件:

  • 使用RMAN删除不需要的备份集和归档重做日志——这是不推荐的,因为这样做可能危及的能力恢复数据库在紧急事件。
  • 使用RMAN减少恢复窗口——这也不推荐,因为增量备份策略需要7备份(一个完整和零个或多个渐进映像)。
  • 增加数据库初始化参数的值db_recovery_file_dest_size——这将有助于只要有足够的空闲磁盘空间db_recovery_file_dest在指定的位置参数。
  • 增加更多的物理存储到数据库服务器存储备份集和归档重做日志——这将有助于只要db_recovery_file_dest_size使用分配存储足够大。

如果主数据库和备用数据库时的可用被激活,可以进行“切换”;否则,必须执行一个“故障”。

切换到备用服务器

如果主数据库是可用的和未损坏的,但必须从服务中移除任何理由(例如:紧急关闭空调系统故障的情况下),它可能会执行一个切换到备用数据库,如果有足够的时间来这样做在主系统失败。

切换到备用数据库需要以下步骤(重复为每一个主数据库服务器):

  1. 确认备用数据库同步与主通过发出以下O / S命令oracle在主数据库服务器:
    1. /home/oracle/oakdba/hourly/check_standby。shl刺激
    2. /home/oracle/oakdba/hourly/check_standby。shl AMPROD
    3. /home/oracle/oakdba/hourly/check_standby。shl DWPROD
  2. 如果备用数据库与初选同步,你可以继续下面的步骤;否则,数据库管理员必须采取行动让他们同步。
  3. 有网络团队准备一个DNS变化的CName主数据库服务器转移到备用数据库服务器。
  4. 执行以下步骤为每个主要影响服务器上的数据库:
    1. 在主数据库,问题”从V $数据库选择SWITCHOVER_STATUS;“
      1. 如果返回值是“备用”或“会议活动”,你可以进行切换。如果返回不同的值,有一个问题日志传输从主备用,和一个切换会导致数据丢失。
    2. 在主数据库,问题“改变数据库提交转换到物理与会话关闭备用;”
    3. 在主数据库,问题“关闭中止;“
    4. 如果你打算让主数据库立即承担备用角色,然后在主数据库,问题“启动;山”
    5. 备用数据库,问题”从V $数据库选择SWITCHOVER_STATUS;“
      1. 如果返回的值是“主”或“会议活动”,你可能会进行切换;
      2. 否则,确保归档重做日志从主数据库被运输和应用。
      3. 继续上面的查询问题,直到返回的值是“主”或“会议活动”。
    6. 在备用数据库,问题“改变与会话关闭数据库提交切换到主;”
    7. 在新主(原备用),问题“改变数据库开放;”
    8. 新的备用(以前小学),问题“改变数据库恢复管理备用数据库使用当前日志文件从会话断开;”
    9. 在新的备用,编辑/etc/oratab,改变数据库的国旗从“Y”到“S”。
    10. 在新主,编辑/etc/oratab,改变数据库的国旗从“S”到“Y”。
  5. 有网络团队立即部署DNS改变早准备。

故障转移到备份服务器

如果主数据库服务器已经失败和/或受损,不可能执行切换;然而,如果备用服务器是可用的和未损坏的,可以执行故障转移。

故障转移到备用数据库需要以下步骤(重复为每一个主数据库服务器):

  1. 确保主数据库。
  2. 如果可能的话,O / S命令sudo触摸/etc/nodatabase在数据库服务器上。立即如果你不能这样做,然后重新启动服务器进入单用户模式,当你有能力,和之前发出上述联系命令执行定期重启服务器。
  3. 确认备用数据库与主数据库同步:
    1. 在备用数据库,问题”选择独特的线程#为线程,马克斯(#)序列(由线程#分区),最后从V $ ARCHIVED_LOG;“确定最高的日志序列号。
    2. 在备用数据库,问题”选择线程#、LOW_SEQUENCE # HIGH_SEQUENCE #从V ARCHIVE_GAP美元;“以确定是否有任何归档重做日志的差距。
    3. 如果显示任何差距,复制或恢复相关的归档重做日志从低到高的顺序数字包容。如果你不能做到这一点,一个故障转移操作将导致数据丢失。
    4. 问题”改变数据库注册物理日志文件的文件规范;“为每一个归档重做日志文件恢复。
    5. 重复步骤b,直到没有差距。
  4. 有网络团队准备一个DNS变化的CName主数据库服务器转移到备用数据库服务器。
  5. 备用数据库,问题“改变数据库恢复备用数据库管理取消;”
  6. 在备用数据库,问题“改变数据库恢复备用数据库完成管理;“。
  7. 从步骤3如果没有错误,你可以继续如下:
    1. 在备用数据库上,“从V $数据库;选择SWITCHOVER_STATUS”。如果上面的查询的结果是“主”或“会议活动”,你可以继续;否则,重复这个查询,直到你看到这两个反应之一。如果您没有看到一个可接受的响应在几分钟内,你应该打开一个优先级1客户支持请求Ellucian如果您还没有这么做的话)。
    2. 在备用数据库上,一旦你有一个可接受的响应从上面查询,问题“改变与会话关闭数据库提交切换到主;”
  8. 如果你收到一个错误信息未解决的重做差距从步骤3,和你已经执行步骤1,你可以继续;然而,会有数据丢失。如果你选择继续,进行如下:
    1. 在备用数据库,问题“改变数据库激活物理备用数据库;”
    2. 基于解决重做空白,记下数据丢失的影响;横幅操作委员会将需要得到通知,以便数据丢失可能进来。
  9. 在新的主(以前备用)数据库,问题“改变数据库开放;”
  10. 有网络团队立即部署DNS改变早准备。
  11. 当旧主服务器可用的服务,数据库管理员需要重新创建备用数据库,和一个切换使用上述过程将需要计划。

甲骨文RMAN备份

这些备份每日在数据库服务器上执行上述安排。RMAN工具创建备份集从数据库文件和归档重做日志文件;这些文件在磁盘上的数据库服务器存储压缩和维护专门用于这一目的。RMAN还管理清洗旧的备份集和归档重做日志,基于数据库的配置的保留政策。

RMAN可以检测和修复数据损坏的错误;它也可以用来手动检查等腐败使用RMAN中的“验证数据库;”命令。

在失败的情况下,需要媒体备份,RMAN可以用来恢复丢失或损坏数据库文件,或者可以恢复整个数据库,数据库时的时间点是稳定的。任何工作承诺后选择的时间点会丢失。

我们将使用这些备份作为第二道防线,后确定为故障转移/切换备用数据库不可用(由于不完整的重做日志的应用,传播从主数据库数据损坏,或其他损坏备用服务器或数据库)。

恢复过程的细节取决于类型的损伤发生的(失去整个数据库,失去一个或多个个人数据文件,控制文件的损失,损失的重做日志块腐败,等等)。RMAN可以用来恢复整个数据库,或单个文件。RMAN跟踪数据库故障检测,并能提供指令自动或手动修复。

如果可能的话,为特定指令恢复或修复数据库,浏览到https://docs.oracle.com/en/database/database.html,选择您所使用的版本数据库,单击“高可用性”链接,搜索的备份和恢复用户指南的场景最适合给定的情况。

一些文档对于所选定的几个场景如下所示。

全手动的数据库恢复

如果全部或大部分数据库文件丢失或损坏,但你仍然有至少一个有效的数据库的控制文件的副本,您可以执行一个完整的恢复整个数据库如下:

  1. 在数据库服务器上,成为了oracle用户。ORACLE_SID出现提示时,输入您想要恢复的数据库。
  2. 数据库恢复必须关闭。作为根用户,问题“systemctl停止oracledb”关闭服务器上的所有数据库。
  3. 作为oracle用户,“rman目标/”命令进入rman子系统。
    1. “启动”发出该命令挂载;启动数据库在适当的模式。
    2. 发出该命令恢复数据库;“从备份文件恢复数据库。
    3. 发出该命令恢复数据库;“通过归档重做日志前滚。
    4. 如果没有错误,问题”改变数据库打开,“打开数据库。
  4. 一旦所有数据库需要复苏已经成功恢复,作为根用户,问题“systemctl重启oracledb”停止所有数据库,然后再把它们与旗帜服务活动。

数据库失败

如果有数据损坏,使用RMAN从数据库故障恢复的过程如下:

  1. 在数据库服务器上,成为了oracle用户。ORACLE_SID出现提示时,输入您想要恢复的数据库。
  2. 发出该命令“rman目标/”进入rman子系统。
    1. RMAN命令”列表失败,“显示数据库的数据库失败。每个故障都有一个惟一的ID号码,和一个“打开”或“关闭”状态,和优先级的“关键”,“高”或“低”。一些失败的可能组合在一起,如果他们是相似的,可以一起处理。如果有任何打开失败,您需要检查它们。关键和高优先级故障的情况必须立即予以处理。
    2. RMAN命令”建议失败,“查看说明如何进行。RMAN将手动或自动恢复步骤列表。如果可能的话,RMAN将构建一个脚本执行部分或全部所需的维修。
    3. 如果任何手动步骤列出,这些第一;然后重复上述步骤3。
    4. 如果没有手动步骤列出,或者他们不能执行,执行“修复失败预览,查看自动化步骤将运行;然后执行“修复失败;”来运行它们。应对任何提示您。
    5. 执行维修后,问题”列表失败,“确认所有故障现在已经关闭。
    6. 如果你手动执行维修,RMAN不得记录修复。你可以进入“改变失败< ID >关闭,”如果你相信失败被修好了;然而,如果失败将重新创建一个新的ID验证仍发现它未来的失败。

DataAdminHowTo

DB_Administration