《編輯案頭》

| | | | 轉寄

系統較為穩定了

索引 | « 前篇 | 次篇 »

這次,我們主要是要把兩年半前購買,價值20多萬的 90G SCSI RAID更換為 10萬元左右,600G 的IDE RAID。並且引進 lvm 與 journaling file system, 以提供可以自由縮放的硬碟分割功能與當機快速修復的檔案系統。我們預期建造 一個巨大、容易調整、穩定安全而且便宜的全新檔案系統,然後把舊的SCSI RAID 移到台北機房,供台北站使用。

於是,我們用了一個禮拜的時間,利用tech(技術組測試機器)先在新RAID 上安裝 redhat 7.3 系統,並且把舊資料搬過去,然後啟動新系統。沒想到在這個 過程中,遭遇到 tech 的 SCSI 卡不穩定,而後終究損壞的事件,讓我們查了半天 ,浪費了一個多禮拜的時間,才搞定。其間當然花了不少精力,我自己重裝redhat 7.3 至少有十幾次,又跑了不少次電腦公司,浪費了不少長途電話費....當然,我們不 用太差的SCSI卡,乃是使用 AHA 的高檔卡,只是沒想到發生這種問題。

真正重大的損失,是在我們已經完成life的安裝,正利用tech安裝bbs時, SCSI卡正式宣告損壞,而損壞的結果造成SCSI卡送出亂七八糟的信號,以至於 裝在同一台RAID上的 life (已經裝好了的)檔案系統嚴重損毀。本來,我們使用 ext3 這種 journaling file system ,具有如同資料庫般的容錯功能,就算電源 被直接關掉,重新開機只要幾秒鐘就可以正常運作,不用耗費長時間去檢查硬碟。但是遇到tech的SCSI卡損壞,卻讓整個系統出現一些奇怪的不穩定狀況,直到 昨天我還在排除這些錯誤導致的問題....至於硬體的損失就不用說了,我們 又乖乖的去買了一片近萬元的高檔 SCSI卡。

不管怎麼說,還是要感謝主,看著PDA上面的代辦事項一件一件的減少, 也就表示我們的系統一天一天的穩定健全。終於我們快要可以享受lvm與 journaling file system 的穩定與好處了(也就是這樣我才能在這裡報告 進度)。目前,僅剩的兩件大工程,就是我們必須進行高檔 SCSI卡的遷移( 要把高檔的卡換到工作的主機上,總不能一直放在測試用的 tech 上吧!) ,並且進行 RAID 的硬碟抽換演習。這些事情,都預計在本週一(2003.03.24) 晚上南部技術組開會後進行,如果上帝保守,一切順利,則南部機房可以 進入另一個穩定的時期了。600 G(BBS 200G Life 400G)要灌爆,至少要 過個兩三年吧?

一切的計畫與保護措施,有時也敵不過意外的重大損壞。週一的大動作, 仍需您的代禱,我們預計停機時間將在一個小時之內。喔!忘了說,承蒙 神的恩典與mic的幫忙,我們找到六個硬碟的 RAID,所以使用六個120G的硬碟 後,可以用十萬元多一點的價格買到我們心目中的 RAID,這對我們拮据的預算 ,有重大的意義。