Armadilloフォーラム

wwan-force-restart後、NetworkManagerが再起動されてしまう

anysense

2020年9月25日 11時52分

いつもお世話になっております。Anysenseです。

wwan-force-restart(モデムリセット)後、usb1デバイスの再接続処理が開始されますが
処理途中で以下のようなプロセスKILLが発生し、NetworkManagerの再起動の発生しています。
daemon warning systemd[1]: NetworkManager.service: Main process exited, code=killed, status=11/SEGV

こちらの症状なにか原因はございますでしょうか?ログを添付しますのでご確認をお願いします。
調べた限り直近1週間で30回発生したモデムリセット中、3回で発生しています。

※モデムリセットのトリガー
設定したIPアドレスにPingが届かない時間が3分継続した場合wwan-force-restart(モデムリセット)するようにしています。

ファイル ファイルの説明
syslog.txt シスログ
コメント

at_mitsuhiro.yoshida

2020年9月29日 9時55分

吉田です。

お手数おかけします。
確認したいことが幾つかあります。

(1) 以下のパッケージのバージョンを教えて頂けますでしょうか?
- modemmanager
- els31-utils
- atmark-x1-base
全て
# apt show パッケージ名
で表示可能です。

(2) カーネルのバージョン
# uname -a
で表示可能です。

(3)
> ※ モデムリセットのトリガー
> 設定したIPアドレスにPingが届かない時間が3分継続した場合
> wwan-force-restart(モデムリセット)するようにしています。

とのことですが、これは標準で動作しています、
connection-recover サービスとは別に
動作させているサービスやアプリになりますでしょうか?

また、上記が yes の場合、connection-recover サービスは
停止させていますでしょうか?

anysense

2020年9月29日 11時33分

ご連絡ありがとうございます。
以下回答します。

> (1) 以下のパッケージのバージョンを教えて頂けますでしょうか?
> - modemmanager
Version: 1.6.4-1atmark5

> - els31-utils
Version: 1.1.0

> - atmark-x1-base
Version: 2.3.2-1
>
> (2) カーネルのバージョン
> # uname -a
Linux armadillo 4.9.133-at12

> (3)
> > ※ モデムリセットのトリガー
> > 設定したIPアドレスにPingが届かない時間が3分継続した場合
> > wwan-force-restart(モデムリセット)するようにしています。
>
> とのことですが、これは標準で動作しています、
> connection-recover サービスとは別に
> 動作させているサービスやアプリになりますでしょうか?
はい、ご認識の通りです。

> また、上記が yes の場合、connection-recover サービスは
> 停止させていますでしょうか?
添付させて頂いたシスログはconnection-recoverと独自サービスが両方稼働中のものです。
※connection-recoverのFORCE_REBOOTはFALSEに設定しています。

後日、独自サービスとのバッティングを疑いconnection-recoverを停止しましたが
同様な事象が発生していました。

at_mitsuhiro.yoshida

2020年9月30日 16時01分

吉田です。

情報提供ありがとうございます。

もし、検証されていましたら確認したいのですが、

(4) 独自のサービスやアプリの ping チェック → wwan-force-restart 実行を停止し、
connection-recover だけ動作させても同様に
NetworkManager が異常終了しますでしょうか?

(5) 不具合に関連するか不明ですが、ログに以下の情報があります。

2020-09-23 11:00:51 daemon info nm-dispatcher[28092]:  run-parts: /etc/network/if-up.d/static-routes exited with return code 7

ログをみたところ、
/etc/NetworkManager/dispatcher.d/01ifupdown
から
/etc/network/if-up.d/static-routes
を実行し、エラーになっているように見受けられます。

タイミング依存で、static ルーティングの設定が失敗することがあり、
それをトリガーに異常終了する可能性があるのかもしれません。

/etc/NetworkManager/dispatcher.d/01ifupdown
/etc/network/if-up.d/static-routes
の2ファイルはどのような内容になっていますでしょうか?

anysense

2020年10月1日 14時09分

ご連絡ありがとうございます。以下回答します。

> (4) 独自のサービスやアプリの ping チェック → wwan-force-restart 実行を停止し、
> connection-recover だけ動作させても同様に
> NetworkManager が異常終了しますでしょうか?
申し訳ありませんが、こちらまだ試していません。
お手数ですが、connection-recoverの簡単な仕様をご教示頂けますでしょうか。
何分Ping失敗したら何が起きるなど

(5) 不具合に関連するか不明ですが、ログに以下の情報があります。
> /etc/NetworkManager/dispatcher.d/01ifupdown
> /etc/network/if-up.d/static-routes
> の2ファイルはどのような内容になっていますでしょうか?

ご指摘いただいた、2つのファイルを添付します。
確認ください。
static-routes で/sbin/route del default eth0
で存在しないデフォルトルートを削除しようとしてretuen code7 Nosuch Processになっていると思われます。

よろしくお願いします。

ファイル ファイルの説明
files.zip /etc/NetworkManager/dispatcher.d/01ifupdown、/etc/network/if-up.d/static-routes

anysense

2020年10月1日 14時16分

申し訳ありません、以下の内容ですが、製品マニュアルに記載されていましたので
回答不要です、失礼しました。
> > (4) 独自のサービスやアプリの ping チェック → wwan-force-restart 実行を停止し、
> > connection-recover だけ動作させても同様に
> > NetworkManager が異常終了しますでしょうか?
> 申し訳ありませんが、こちらまだ試していません。
> お手数ですが、connection-recoverの簡単な仕様をご教示頂けますでしょうか。
> 何分Ping失敗したら何が起きるなど

anysense

2020年10月21日 9時31分

> > > (4) 独自のサービスやアプリの ping チェック → wwan-force-restart 実行を停止し、
> > > connection-recover だけ動作させても同様に
> > > NetworkManager が異常終了しますでしょうか?
期間が開いてしまい申し訳ありません。
connection-recoverのみ動作させましたが、同様の結果(NetworkManager 異常終了)になりました。
また検証中にconnection-recover内の"nmcli connection up"コマンドが終了しない事象が発生したため
一時的に"timetou 60"をnmcli connection upコマンドに追記して検証しておりました。

当時のシスログと/usr/bin/connection-recoverd を添付しますので
ご確認のほどよろしくお願いします。

ファイル ファイルの説明
syslog_connection_recover_only.txt connection-recoverのみで発生したNetworkManager 異常終了
connection-recoverd.txt /usr/bin/connection-recoverd