Log Files
檔案目錄: /u01/app/oracle/ovm-manager-3/domains/ovm_domain/servers/AdminServer/logs/
Log Parsing Tool: OvmLogTool.py
檔案目錄: /u01/app/oracle/ovm-manager-3/ovm_tools/
由於 AdminServer.log 的內容不易讀取,使用這指令格式化 log 內容。
cd /u01/app/oracle/ovm-manager-3/ovm_tools/ python OvmLogTool.py -s -o ~/ovm_logs/summary.`date +%y%m%d_%H%M`
格式化後的結果會儲存在 ~/ovm_logs/summary.<todaty_now>
TIP:
-s , 只會顯示 Error 相關的 Log; 不加則會顯示所有 Log。
檢查 MySQL 的資料表使用空間
# du -chs /u01/app/oracle/mysql/data/ovs/OVM_STATISTIC*
16K /u01/app/oracle/mysql/data/ovs/OVM_STATISTIC.frm
121G /u01/app/oracle/mysql/data/ovs/OVM_STATISTIC.ibd <===
解決:
關閉 ovmm
service ovmm stop
檢查資料表 OVM_STATISTIC 的筆數
mysql -u ovs -p -S /u01/app/oracle/mysql/data/mysqld.sock ovs Enter password: <網頁登入密碼> mysql> select count(*) from OVM_STATISTIC; +-----------+ | count(*) | +-----------+ | 184795278 | +-----------+ 1 row in set (6 min 35.98 sec)
清除資料表 OVM_STATISTIC
mysql> truncate table OVM_STATISTIC;
TIP: truncate 基本上是先執行 drop 再 create,既使 1 億多筆資料幾秒鐘就會完成清除。
VM 狀態一直顯示 Stopping,執行 Kill 失敗,出現錯誤:
tpeoddovm-db01 <1108> is locked. job info: job id(time):1525839275699 name:Stop VM: tpeoddovm-db01 description:Stop VM: tpeoddovm-db01
解決:試試重啟該 VM 所在的 OVS 主機裡的 ovs-agent 服務
service ovs-agent stop service ovs-agent start
重裝完 OVS 與 OVM Manager 主機後,無法使用原有的 LUNs 建立 Server Pool 與 Repository。
解決:SSH 登入 OVS 主機,清空 LUNs 的資料
找出 LUN 路徑 #> multipath -ll #> dd if=/dev/zero of=/dev/mapper/360a980004434375a385d4747374b5155 bs=1M count=256
錯誤訊息:
Unexpected error during login (java.lang.NullPointerException)
解決:二擇一
錯誤訊息
Caught during invoke method: com.oracle.ovm.mgr.api.exception.IllegalOperationException....
解決:在遷移 VM 之前,請先將它的 Event Serverity 狀態從 Critical 變更成 Informational。步驟如下:
先前由於硬體維護工作,造成 Storage 短暫的連接異常,但解決異常後,Error 圖示 仍保持顯示
解決:OVMM Admin > Repositories > 選擇 Storage Repository > Perspective: 選擇 Events
選擇尚未處理的舊事件,按 Acknowledge,完成
有一個 OVS 需要重新安裝,但無法從已經加入的 Clustered Server Pool 中移除,出現以下錯誤:
OVMRU_000036E Cannot remove server: tycoddovs01.winfoundry.com, from pool: oddfdc_db. There are still OCFS2 file systems
解決:要移除從 Clustered Server Pool 裡移除其中一台 OVS 主機,必須符合下列條件
假使這個 OVS 是 Server Pool 裡唯一的主機,可以使用下述步驟,強制將它從 Server Pool 內移除。
1. SSH 登入至該 OVS 主機,執行以下指令:
service ovs-agent stop rm -rf /etc/ovs-agent/db cat /dev/null > /etc/ocfs2/cluster.conf service ovs-agent start
2. 登入 OVMM 後,從控制台的視窗,應該就會顯示該 OVS 主機是在 Unassigned Servers 狀態。
TIPs:
* 一旦 OVS 呈現 Unassigned 狀態後,如果還是無法刪除舊 Server Pool (可能出現錯誤 Internal Error),可以先重啟 OVMM 主機後,確認 OVS 與 OVMM 的時間都有同步,再刪除一次。
* 呈現 Unassigned 的舊 OVS 主機,若要在控制台上將它刪除,可能無法成功,此時先對舊 OVS 做一次 Discover Servers,完成後應該就能從控制台,將舊 OVS 主機移除。
NOTE:做完 Discover Servers 後,控制台可能會出現 Unknown Server Pool.....,這是來自舊的設定,請將它徹底移除即可。
問題描述:
使用 VM template 新增的 VM 後,發現預設的系統磁碟容量太小,要如何才能加大容量?
1. 使用 OVMM 將 VM 的 System 磁碟增大
OVMM > Servers and VMs > 選擇 VM > 編輯 VM > Disks > 編輯 Slot 0 的磁碟
2. 登入 VM 後,執行以下操作
記下 SWAP 的大小
> free -m 例如是 2048M
關閉 SWAP
> swapoff /dev/xvda3
-1 刪除 xvda3 & xvda2 磁區
-2 重建 xvda2 (+48G) & xvda3 (剩餘空間)
-3 寫入後離開
> fdisk /dev/xvda
重啟 VM
reboot
格式化 SWAP
> mkswap /dev/xvda3 > swapon /dev/xvda3
Resize 根目錄
> resize2fs /dev/xvda2
(http://docs.oracle.com/cd/E26996_01/.../BABFCCHE.html)
建議做法是將 OVMM 設定為 NTP Server,所有的 OVS 主機與 VM 自動向 OVMM 做校時。
OVMM 設定 NTP)
OVS 設定 NTP)
OVMM 3.3.x 不需要在 OVS 上做設定,當使用 VM Manager 第一次加入 OVS 時,系統會自動修改 OVS 的 ntp.conf。
VM 設定 NTP)
VM(guest OS) 如果是用 OEL template,而且 Linux kernel 是 UEK based。當 VM 重啟時,系統時間會與 OVS 主機相同,不過,直到下次重啟前,系統運行過程並不會與 OVS 主機做校時,如果 VM 長時間不做重啟,必須手動設定 NTPD 或 ntpdate 校時功能。