manabu-yoshioka-arc
2024年7月5日 3時34分
お世話になっております。
Armadillo-IOT A6 を使用した機器の連続試験において、不定期にリブートがかかる状態が出ています。
頻度は 14日間の連続テストで15回、発生しない時は3日間連続で出ない時もありますが、発生する時は1日に3回発生している時もあります。
ちなみにリブートの確認は、ブート時に対向サーバにブートの報告を LTE 通信経由で上げているのでそのログでの確認です。
別途監視カメラで撮影も行っており、そちらでの検証はできるのですが、まだ解析はできていない状況です。
テストは2台で行っており、うち1台でリブートの問題が出ています。もう一台には出ていません。
現象から、LTE通信部分でのリブート、または電源電圧低下によるリブートではないかと考えています。
1. LTE通信でのリブートするかしないかの設定の確認箇所(connection-recover.conf など)を教えてください。確認します。
2. LTE通信でのリブートが発生した場合のアルマジロ内のログがあるはずであれば、その場所を教えてください。(現在 overlay 効かせてます)
3. 電源で夏低下でのリブートが発生した場合のアルマジロ内のログがあるはずであれば、その場所を教えてください。(現在 overlay 効かせてます)
その他、御社の知見で、こういう事例があったというものがあれば情報いただけると助かります。
よろしくお願いします。
コメント
manabu-yoshioka-arc
2024年7月5日 11時56分
ご回答ありがとうございます。質問がわかりにくかったでしょうか。すみません。
電源のドロップと同様に、LTE 回路の設定や動作でリセットがかかっているのではと疑っております。のでそちらについてのみ、ご回答いただければと思います。
overlay を外せば、通信部分のログが残すような設計になっていないでしょうか。そうなっているならそのファイル位置を教えてください。
例えば PING が通らなくなったのでリブートに入る、と言うような自発的なリブートの証拠みたいなものが掴めないかと期待しています。
また、
> > 1. LTE通信でのリブートするかしないかの設定の確認箇所(connection-recover.conf など)を教えてください。確認します。
についても回答をお願いします。リブートの設定は false にしているつもりですが、間違いがないかどうか確認しておきたいのです。
設定ファイルの位置も、フルパスで明示をお願いします。
よろしくお願いします。
at_mizo
2024年7月5日 12時59分
溝渕です。
こちらこそ意図を汲み取れておらず、すみませんでした。
> 電源のドロップと同様に、LTE 回路の設定や動作でリセットがかかっているのではと疑っております。のでそちらについてのみ、ご回答いただければと思います。
リブートするのは、「Armadillo-IOT A6」ではなく、「LTEモジュール」という認識で宜しいでしょうか?
私は、「Armadillo-IOT A6」がリブートするとの認識で回答しており、その場合はリセット要因が何であったとしてもログは残らない事が大半であると回答しました。
質問を質問で返して申し訳ございませんが、まずは問題となっている現象を把握したいので、上記回答をお願いいたします。
manabu-yoshioka-arc
2024年7月5日 13時58分
回答ありがとうございます。
「Armadillo-IOT A6」がリブートしています。
正確には、crontab に @reboot で登録した シェルスクリプトが、弊社サーバに向かって、「私(リブートのシェルスクリプト)が走りました」と言いうメッセージを発しています。(「Armadillo-IOT A6」は外部の LED 表示装置の制御に利用しており、もともと連続稼働テスト中に表示が電源投入時の表示になるという報告を受けて追加したプログラムがこのシェルスクリプトです)
ご回答によると、PING をうってリブートすると言うのは、LTE 回路だけなのでしょうか。私はてっきり 「Armadillo-IOT A6」とは LTE 回路を含むシステムであり、通信部で異常が起こったら(PING をうってレスポンスがなかったら)「Armadillo-IOT A6」丸ごとリセットするプログラム(設定)があるのだとマニュアルを読み違えておりました。
ですので、その設定は False にしたはずだけども、この不具合の原因かもしれないので確認しておこう、間違った設定ファイルだと深みにはまって行くのでと思い、質問させていただいた次第です。
つまり、
通信部分で「Armadillo-IOT A6」自体を Reboot する回路もプログラムはない、
PING が通らなくなってリセットするプログラムが仮に走ったとしても、LTE 回路だけのリセットである、
私の述べた症状(crontab に設定した @reboot 部分が走っている)ことから、「Armadillo-IOT A6」のリブートが起こっていることは間違いない(ログは取れない)
と言うことでよろしいでしょうか。
ご確認お願いいたします。
at_mizo
2024年7月5日 14時38分
溝渕です。
ご回答ありがとうございます。
> 「Armadillo-IOT A6」がリブートしています。
> 正確には、crontab に @reboot で登録した シェルスクリプトが、弊社サーバに向かって、「私(リブートのシェルスクリプト)が走りました」と言いうメッセージを発しています。
了解です。
> ご回答によると、PING をうってリブートすると言うのは、LTE 回路だけなのでしょうか。私はてっきり 「Armadillo-IOT A6」とは LTE 回路を含むシステムであり、通信部で異常が起こったら(PING をうってレスポンスがなかったら)「Armadillo-IOT A6」丸ごとリセットするプログラム(設定)があるのだとマニュアルを読み違えておりました。
Armadillo-IoT A6Eの場合は、上記ご認識で合っています。
今回ご利用されているArmadillo-IoT A6には上記機能は存在しません。
> 通信部分で「Armadillo-IOT A6」自体を Reboot する回路もプログラムはない、
> PING が通らなくなってリセットするプログラムが仮に走ったとしても、LTE 回路だけのリセットである、
> 私の述べた症状(crontab に設定した @reboot 部分が走っている)ことから、「Armadillo-IOT A6」のリブートが起こっていることは間違いない(ログは取れない)
> と言うことでよろしいでしょうか。
概ね合っています。
問題を解決していくには、リブートの要因を特定する必要があるかと思います。
コンソール(Debug UART)を接続しておくと、(ログファイルとして残せない)ログが再起動する際に出力される場合があります。コンソールを接続しておく事は可能ですか?
at_mizo
2024年7月5日 9時41分
溝渕です。
> 1. LTE通信でのリブートするかしないかの設定の確認箇所(connection-recover.conf など)を教えてください。確認します。
> 2. LTE通信でのリブートが発生した場合のアルマジロ内のログがあるはずであれば、その場所を教えてください。(現在 overlay 効かせてます)
> 3. 電源で夏低下でのリブートが発生した場合のアルマジロ内のログがあるはずであれば、その場所を教えてください。(現在 overlay 効かせてます)
上記、いずれも確認不可能と思います。
リブートが発生 == Linuxカーネルが動作できない状況
とみるのが妥当と思います。Linuxカーネルが動作できない状態で、ログ出力(ファイルシステムへの書き出し)はできない事が大半です。
> その他、御社の知見で、こういう事例があったというものがあれば情報いただけると助かります。
リブート発生時、コンソール(Debug UART)にエラー内容が表示される場合があります。また、電圧ドロップを疑っているのであれば、オシロスコープで電源電圧をトリガをかけて監視しておくと良いと思います。