はまったはまった ― 2019年06月16日 18:46
いろいろとハマった感。
6月頭に一応環境はできたので、いろいろ負荷をかけてみたわけです。するとネットワーク通信の重い負荷をかけるとESXiが外のNWから無応答になるという事象。でもこの状態でもIPMI経由での電源制御はできる、と。
最初はメモリの割当を減らしたりするとなんとか安定したので、メモリ周りかな、と思ってたのですが、memtestしても特に問題は出ない。
固まったときには外から入れないのでESXi自身が死んだように見えるのですが、いろいろ切り分けた結果ようやく原因にたどり着きました。
いろいろ悪戦苦闘した結果、最後にESXiが原因に見えたのでESXiを抜いてXigmaNASを直接入れて、その上で仮想基盤としてVirtualboxを立ち上げてそこでzabbixを動かした上で負荷をかけたわけです。でも同じ事象になるので、これは特定のソフト起因じゃない(ハードに起因した問題だぞ)と。
LANを1本しか引いてきてないので、IPMIのInterface modeをfailoverにして常用のLANとIPMIの口を共用していたわけですが、ふと負荷をかけるとここが刺さるのではないか、と思いつきました。
で、試しにDedicatedにしてinterfaceを分離してあげると、たしかに負荷をかけても落ちなくなりました。うぼわぁ。
あとからよくよく見てみれば、確かに刺さった際にも仮想上で動いているzabbixの自身のCPUのグラフとかはちゃんと更新されてるから、仮想基盤(Virtual box)自体が落ちたわけではないんだよなぁ、と。気づくのが遅い・・・。
まぁ、いろいろあれこれ想像して切り分けに時間がかかったけど、原因がきちんとわかったのでよしとすることにします。
さて、Xigmanas上のVirtualBOXでよしとするか、ESXiに戻すか、どうするかなぁ・・・。
6月頭に一応環境はできたので、いろいろ負荷をかけてみたわけです。するとネットワーク通信の重い負荷をかけるとESXiが外のNWから無応答になるという事象。でもこの状態でもIPMI経由での電源制御はできる、と。
最初はメモリの割当を減らしたりするとなんとか安定したので、メモリ周りかな、と思ってたのですが、memtestしても特に問題は出ない。
固まったときには外から入れないのでESXi自身が死んだように見えるのですが、いろいろ切り分けた結果ようやく原因にたどり着きました。
いろいろ悪戦苦闘した結果、最後にESXiが原因に見えたのでESXiを抜いてXigmaNASを直接入れて、その上で仮想基盤としてVirtualboxを立ち上げてそこでzabbixを動かした上で負荷をかけたわけです。でも同じ事象になるので、これは特定のソフト起因じゃない(ハードに起因した問題だぞ)と。
LANを1本しか引いてきてないので、IPMIのInterface modeをfailoverにして常用のLANとIPMIの口を共用していたわけですが、ふと負荷をかけるとここが刺さるのではないか、と思いつきました。
で、試しにDedicatedにしてinterfaceを分離してあげると、たしかに負荷をかけても落ちなくなりました。うぼわぁ。
あとからよくよく見てみれば、確かに刺さった際にも仮想上で動いているzabbixの自身のCPUのグラフとかはちゃんと更新されてるから、仮想基盤(Virtual box)自体が落ちたわけではないんだよなぁ、と。気づくのが遅い・・・。
まぁ、いろいろあれこれ想像して切り分けに時間がかかったけど、原因がきちんとわかったのでよしとすることにします。
さて、Xigmanas上のVirtualBOXでよしとするか、ESXiに戻すか、どうするかなぁ・・・。
コメント
トラックバック
このエントリのトラックバックURL: http://marshall.asablo.jp/blog/2019/06/16/9087830/tb
※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。
※なお、送られたコメントはブログの管理者が確認するまで公開されません。