存储区域网络 – 光纤通道:总线复位时覆盖LTO磁带

我们有一种情况,我希望客户能够更好地理解.

这是发生的事情:

>具有LTO磁带机的磁带库连接到光纤通道环境
>在Windows Server 2008上运行的归档软件正在将数据写入磁带
>在某些时候,磁带被重新启动而软件没有意识到这一点并且写入擦除了磁带
>通过将磁带上的预期位置与实际位置进行比较来检测情况

我没有关于设备供应商的详细信息.

似乎磁带驱动器上发生了重置,导致磁带倒带,但这种情况并未报告为驱动程序和软件的错误,因此软件认为写入成功.

我正在阅读大量文档以了解发生这种情况的原因,但我无法做出任何最终结论来帮助客户.

> FC HBA或交换机是否可以在总线重置时重新发送SCSI写入?

>这样的东西可以配置吗?

> FC HBA或交换机是否忽略了报告的单位注意?
>可以责怪操作系统驱动程序吗?
>这个供应商是否具体?

如果有人能给我一些指导,我会非常感激.

这是磁带驱动器的一个已知问题,并且它们只是通过侧向观察设备(即,以错误的方式打开它 – 通过倒带设备 – 仅仅例如检查状态)来轻松地倒带的方式.

至少有一个主要的UNIX备份软件是如此担心,它只是拒绝写入磁带第二次,直到磁带准备好被删除;这是从the amanda FAQ(特别提到公交车重置作为问题区域):

Why does Amanda not append to a tape?

One run of Amanda = one (set of) tapes. Amanda opens the tape device
once, writes all the images and filemarks, and closes the device once.
Using that sequence, there is no possibility that other programs
interrupt the sequence and rewind the tape, without Amanda noticing.

Doing “mt -f /dev/st0 status” could be enough, or even “amcheck
daily”. Also, an error like a scsi bus reset implies a rewind.

If Amanda would close and reopen the tape drive for each backup image,
there is a window of vulnerability that the tape gets rewound
accidentally, and the next image will overwrite all the good backups
on the tape. And you wouldn’t know unless you tried to restore from
the tape.

When appending to a tape, there is the possibility that, between the
time that Amanda positions to the last image (that already is not
really trivial!), and opening the device for writing, a tape rewind
happens, and in that case Amanda would happily erase ALL of the tape,
containing possibly many days worth of backup.

Bacula同样通过永不关闭磁带设备解决了这个问题,因此在加载磁带时没有其他人可以错误地打开它.但这并没有解决总线重置问题.

从本质上讲,这是一个问题,而且很难.我可能会争辩说,你的备份硬件应该足够坚固,以至于这些不经常发生;如果FC似乎特别容易出现这些问题,那么现在应该更换SAS磁带机,或者至少将磁带设备直接连接到备份服务器,以便从路径中移除光纤交换机等.除此之外,我无法看到你如何做得比你有更多,因为你在通常的观点之前发现了问题,即“我们的恢复不起作用,我们被搞砸了”.

相关文章
相关标签/搜索