如果殺人很可惡,
那頂新跟統一怎麼還沒倒?
只因為有感跟無感嗎?
OpenNMS 心得
在一間連鎖企業當 IT 人員, 分公司遍佈全台灣, 而各分公司業務狀況都是透過 MPLS VPN 回傳, 加上 VoIP 網路電話, 監控系統等資訊設備, 還有 ISP 的 VPN 設備, 就算可以自己寫 shell script 或批次檔來檢查, 也需要不少時間.
之前試用過 Cacti , 可以透過 SNMP 協定詳細列出各主機狀況, 不過以前安裝的設備很少啟用這個功能, 加上要發通報需要額外安裝插件(plug-in), 所以覺得不適合現在的公司環境使用.
後來發現有 Nagios 這套軟體, 看起來功能很多, 不過發現設定檔需要以文字檔儲存, 考慮到一個系統不應該只由一個人會用與維護(至少如果我離職, 不想接電話回答或解釋 :p ), 所以還是放棄.
再來又看到 OpenNMS , 雖然是自由軟體(開放軟體, 名稱或相關授權可能要再確認), 以 Java 開發, Windows / Linux 都可以安裝, 所以初期以 Linux 環境測試, 將來要正式上線的話, 還可以裝在 Windows 上.
既然有工具, 就要先想想工具的用途, 目前公司內已經有:
1. 各分公司的後台主機(業務用).
2. 總公司後台主機(業務用).
3. 總公司機房有一台主機, 已經有同事寫了幾個檢測分公司後台主機的程式.
所以整理一下:
1. 各分公司的後台主機寫幾個排程, 定期做資料庫的整理與備份.
2. 總公司機房主機, 維持檢查公司專用的業務程式是否順利.
3. OpenNMS 專門用來檢查網路與主機是否存活與通報. (SNMP 資源查詢則列入下一階段準備.)
安裝方式就省略, 用 Debian + Oracle Java + PostgreSQL + OpenNMS , 可以找到不少文章.
安裝之前其實就有先想, 資訊系統在公司內的結構與特性, 可以有三種屬性:
1. 地點: 各分公司
2. 功能: VoIP, 後台主機, 監控系統
3. 時間: 後台主機不關機, POS 機則會關機.
所以裝好 OpenNMS 之後, 先確認幾個功能目標:
1. 如何列出所有的設備?
2. 哪些設備需要確認存活與通報?
3. 怎樣的情況才算存活? (例如後台主機與 POS 機使用時機不同)
4. 哪些情況需要通報?
5. 是否會有重複通報的情況? 例如 ISP 斷線, 則該分公司所有主機都連不上, 會不會發的通報很多, 反而讓工作人員很煩.
第1項比較簡單, OpenNMS 把設備稱為 node , 列出設備稱為 discovery , 所以把要列出的 IP , 列在 discovery include range 內即可. OpenNMS 會以常用的服務去查, 例如: ICMP(ping), http, ftp, snmp, smtp 等.
第2項則是有一個 manage 清單, 如果是業務人員帶筆電到分公司, 連線狀況本來就不穩定, 可以在第一項就不列在 include range , 或在 manage 清單中取消勾選.
而通報系統是採用 e-mail 方式, 利用公司現有的 mail server 發信給 IT 人員.
第3到第4項就還在測試, 雖然看到一些網站說可以設定哪些設備有離線時間, 不過還沒成功.
第5項則是希望有階段性的判斷, 例如 ISP 網路設備不通, 後台也不通, 就不用重複發通知, 這個就不強求了.
而下班前, 就發生某分公司斷電, 收到了幾封 mail , 雖然不希望常收到這種信, 不過也表示環境大致上結構是對的, 剩下通報頻率(例如 ISP 瞬斷, 雖然也該修理不過業務可以勉強運作)等.
之前試用過 Cacti , 可以透過 SNMP 協定詳細列出各主機狀況, 不過以前安裝的設備很少啟用這個功能, 加上要發通報需要額外安裝插件(plug-in), 所以覺得不適合現在的公司環境使用.
後來發現有 Nagios 這套軟體, 看起來功能很多, 不過發現設定檔需要以文字檔儲存, 考慮到一個系統不應該只由一個人會用與維護(至少如果我離職, 不想接電話回答或解釋 :p ), 所以還是放棄.
再來又看到 OpenNMS , 雖然是自由軟體(開放軟體, 名稱或相關授權可能要再確認), 以 Java 開發, Windows / Linux 都可以安裝, 所以初期以 Linux 環境測試, 將來要正式上線的話, 還可以裝在 Windows 上.
既然有工具, 就要先想想工具的用途, 目前公司內已經有:
1. 各分公司的後台主機(業務用).
2. 總公司後台主機(業務用).
3. 總公司機房有一台主機, 已經有同事寫了幾個檢測分公司後台主機的程式.
所以整理一下:
1. 各分公司的後台主機寫幾個排程, 定期做資料庫的整理與備份.
2. 總公司機房主機, 維持檢查公司專用的業務程式是否順利.
3. OpenNMS 專門用來檢查網路與主機是否存活與通報. (SNMP 資源查詢則列入下一階段準備.)
安裝方式就省略, 用 Debian + Oracle Java + PostgreSQL + OpenNMS , 可以找到不少文章.
安裝之前其實就有先想, 資訊系統在公司內的結構與特性, 可以有三種屬性:
1. 地點: 各分公司
2. 功能: VoIP, 後台主機, 監控系統
3. 時間: 後台主機不關機, POS 機則會關機.
所以裝好 OpenNMS 之後, 先確認幾個功能目標:
1. 如何列出所有的設備?
2. 哪些設備需要確認存活與通報?
3. 怎樣的情況才算存活? (例如後台主機與 POS 機使用時機不同)
4. 哪些情況需要通報?
5. 是否會有重複通報的情況? 例如 ISP 斷線, 則該分公司所有主機都連不上, 會不會發的通報很多, 反而讓工作人員很煩.
第1項比較簡單, OpenNMS 把設備稱為 node , 列出設備稱為 discovery , 所以把要列出的 IP , 列在 discovery include range 內即可. OpenNMS 會以常用的服務去查, 例如: ICMP(ping), http, ftp, snmp, smtp 等.
第2項則是有一個 manage 清單, 如果是業務人員帶筆電到分公司, 連線狀況本來就不穩定, 可以在第一項就不列在 include range , 或在 manage 清單中取消勾選.
而通報系統是採用 e-mail 方式, 利用公司現有的 mail server 發信給 IT 人員.
第3到第4項就還在測試, 雖然看到一些網站說可以設定哪些設備有離線時間, 不過還沒成功.
第5項則是希望有階段性的判斷, 例如 ISP 網路設備不通, 後台也不通, 就不用重複發通知, 這個就不強求了.
而下班前, 就發生某分公司斷電, 收到了幾封 mail , 雖然不希望常收到這種信, 不過也表示環境大致上結構是對的, 剩下通報頻率(例如 ISP 瞬斷, 雖然也該修理不過業務可以勉強運作)等.
有水當思無水之苦, 有食物當思無可食之難.
Tsai Shih-Jen Jaladanse 在北非進行的"天堂島嶼(原: 沙漠中的小王子)"計劃, 希望能讓糧食自給自足.
在台灣的我們, 也該思考台灣糧食如何安心食用? 例如: 廢水與灌概用水是否分離? 台灣食材有多少自產? 夠不夠台灣自己食用?
Tsai Shih-Jen Jaladanse 在北非進行的"天堂島嶼(原: 沙漠中的小王子)"計劃, 希望能讓糧食自給自足.
在台灣的我們, 也該思考台灣糧食如何安心食用? 例如: 廢水與灌概用水是否分離? 台灣食材有多少自產? 夠不夠台灣自己食用?
桃園曾經有大約九千個埤塘,需要水就可以利用,比大水庫便宜及有用。
由於桃園為傾斜的台地地形, 所以只要挖開部份高地的土, 運往低地, 就可以讓水存在於埤塘; 上下埤塘間, 若以魚鱗狀排列, 則高處的埤塘多餘的水, 會補充低處的埤塘, 這種作法已經有幾百年的歷史, 有記錄的是知母六開挖通宵池.
日本時代, 八田與一則開發了桃園大圳, 引用石門水庫的水, 並串連許多埤塘作為調節池, 而讓桃園農業興起.
後來工業發展, 引進自來水系統, "有些"(數量待查, 只是有看到案例)自來水廠也引桃園大圳的水, 淨化處理後給工業及民生用水之用.
所以先民利用地形造出的埤塘就有儲水功能, 如果用這概念, 找出各地適合的工法(例如湧泉區), 少雨區等, 就可以有廣泛的儲水甚至滯洪的功能.
由於桃園為傾斜的台地地形, 所以只要挖開部份高地的土, 運往低地, 就可以讓水存在於埤塘; 上下埤塘間, 若以魚鱗狀排列, 則高處的埤塘多餘的水, 會補充低處的埤塘, 這種作法已經有幾百年的歷史, 有記錄的是知母六開挖通宵池.
日本時代, 八田與一則開發了桃園大圳, 引用石門水庫的水, 並串連許多埤塘作為調節池, 而讓桃園農業興起.
後來工業發展, 引進自來水系統, "有些"(數量待查, 只是有看到案例)自來水廠也引桃園大圳的水, 淨化處理後給工業及民生用水之用.
所以先民利用地形造出的埤塘就有儲水功能, 如果用這概念, 找出各地適合的工法(例如湧泉區), 少雨區等, 就可以有廣泛的儲水甚至滯洪的功能.
朋友的公司主機用 5 年了, 一直考慮要換, 剛好最近有網拍特價的 NAS + 硬碟組, 就請她先買, 週末再到現場轉換.
雖然之前先在宿舍測試了 4 個小時, 開好帳號. 到了現場要轉移資料時, 網芳資料還好, 權限設定比 Linux 簡單(因為功能較少), 但 mail 從原本主機 IMAP 搬移到新主機 IMAP 時, 遇到特殊字元, thunderbird 需要先有建立清單才會 copy , 加上自己的筆電太慢....整整拖了兩天才備份完, 也讓朋友錯過了母親節活動, 還好最後都順利完成, 再把舊主機退役, 整線, 清潔, 總算完工了.
不過還有無線網路跟防火牆調整設定, 只好下次進行了.
雖然之前先在宿舍測試了 4 個小時, 開好帳號. 到了現場要轉移資料時, 網芳資料還好, 權限設定比 Linux 簡單(因為功能較少), 但 mail 從原本主機 IMAP 搬移到新主機 IMAP 時, 遇到特殊字元, thunderbird 需要先有建立清單才會 copy , 加上自己的筆電太慢....整整拖了兩天才備份完, 也讓朋友錯過了母親節活動, 還好最後都順利完成, 再把舊主機退役, 整線, 清潔, 總算完工了.
不過還有無線網路跟防火牆調整設定, 只好下次進行了.
ASUSTOR Inc. 華芸科技 202TE 簡易無法連線法.
1. 剛裝好 ADM
2. 設定網路連線是 DHCP (預設值)
3. 按 Power 鍵讓主機關機
4. 再開機 -> 202TE 沒有送出 DHCP 封包, 也就無法連線了.
以前還看在 ASUS 集團品牌的份上, 每個 bug 都測試,
沒想到原廠的處理方式是: 72 小時內移除該 ticket !
目前為止就已經發生過:
1. 檔案超過 4G 會異常(不是 FAT 問題, 是 202TE 才有的問題, 已修正)
2. ADM 偶爾會出現異常的 frame 錯誤(推測是 browser 中的 session 資料有錯, 未修正)
3. 無法 WOL (原廠有標)
4. DHCP 異常
哎....
DHCP 要恢復使用的方法(擇一即可):
1. 拔掉電源重插
2. 拔掉系統碟, 開機, 會進入主機板原本的系統, 再關機, 裝回系統碟, 再開機.
1. 剛裝好 ADM
2. 設定網路連線是 DHCP (預設值)
3. 按 Power 鍵讓主機關機
4. 再開機 -> 202TE 沒有送出 DHCP 封包, 也就無法連線了.
以前還看在 ASUS 集團品牌的份上, 每個 bug 都測試,
沒想到原廠的處理方式是: 72 小時內移除該 ticket !
目前為止就已經發生過:
1. 檔案超過 4G 會異常(不是 FAT 問題, 是 202TE 才有的問題, 已修正)
2. ADM 偶爾會出現異常的 frame 錯誤(推測是 browser 中的 session 資料有錯, 未修正)
3. 無法 WOL (原廠有標)
4. DHCP 異常
哎....
DHCP 要恢復使用的方法(擇一即可):
1. 拔掉電源重插
2. 拔掉系統碟, 開機, 會進入主機板原本的系統, 再關機, 裝回系統碟, 再開機.
訂閱:
文章 (Atom)