2022年7月2日深夜に発生したKDDIの通信障害は、完全復旧まで86時間にも及び、コミュニケーションだけでなく社会活動にまで大きな影響を与える非常に規模の大きなものとなった。だがその通信障害の内容からは、KDDIだけでなく携帯電話会社全体で、同様の規模の障害が今後も発生する可能性が十分あり得るようにも感じる。我々はどのような対処をすべきなのだろうか。

KDDIは本当にNTTドコモの教訓を生かせなかったのか?

先の週末に連日報道がなされ、大きな注目を浴びたKDDIの通信障害。2022年7月2日の深夜に発生し、2022年7月5日の15時に完全な回復が確認され、復旧宣言がなされるまで86時間、3日以上にわたってKDDIの通信サービスを利用している人が通話や通信がしづらい状況が続いたというのは、既に多くの人がご存知の通りだ。

  • KDDIの大規模通信障害から考える、モバイル通信の重要性が高まる時代の“備え”

    KDDIは86時間にわたる大規模通信障害を発生させ、社会的にも大きな影響を与えたことから、2022年7月3日の説明会では代表取締役社長の高橋誠氏らが謝罪をしている

その影響が深刻なものとなった要因の1つは、障害の発生個所が携帯電話ネットワークの要となるコア部分、しかも主として音声通話に関する部分であったことだろう。音声通話に障害の影響が大きく及び、通常の音声通話ができなくなっただけでなく、110番などの緊急通報もできなくなったことで影響が深刻化したといえる。

そしてもう1つは同社のモバイル通信サービスがスマートフォンだけでなく「IoT」、要はさまざまな機械同士の通信にも利用されていたことだ。それゆえ一連の障害によって、KDDI回線を利用して情報をやり取りしていたATMや気象観測所などにまで影響が及んだことも、障害の影響範囲を大きく広げた要因となっていることは間違いない。

執筆時点(2022年7月6日)ではまだ障害が収まったばかりで、具体的な原因の究明には至っていない。だが現時点までにKDDI側から障害に至る経緯はある程度公表されており、コアネットワーク内のルーターを交換する際に、4Gのデータ通信で音声通話を実現する「VoLTE」のトラフィックルートを変更したところ、なぜか音声通話が15分間止まってしまったことに端を発するようだ。

  • 通信障害に至る発端はメンテナンス中のルーター交換で、音声通話のトラフィックルートを変更したことにあり、その際15分間音声通話が不通になってしまったという

そこでKDDIはルートを元に戻したのだが、VoLTEによる通信のさまざまな処理を担う「VoLTE交換機」にアクセスが集中し、通信がしづらくなる「輻輳」が発生。その輻輳がコアネットワークの他の部分にも連鎖した結果、大規模障害へとつながったようだ。

  • ルートを元に戻したものの、VoLTE交換機にアクセスが集中して輻輳が発生、それが他の機器にも波及して大規模障害へとつながっていった

この出来事は深夜で通話も少ない時間帯であるにもかかわらず、それだけ短時間の間に輻輳が発生したのには、VoLTEの仕組みが影響している。VoLTEの仕様上、端末が50分に1度定期的にネットワークにアクセスする必要があるそうで、通話が止まった15分間のうちに溜まった定期的なアクセスが、ルート変更で一斉に流れてきたことで輻輳に至ったのではないかと見られているようだ。

輻輳による通信障害と聞くと思い起こされるのが、2021年にNTTドコモが起こした通信障害である。この時もやはりIoT回線向けネットワークのメンテナンス中にトラブルが起き、元に戻すべくIoT端末の位置情報をネットワークに登録し直そうとしたところ、その数が20万にも及んだため輻輳が生じ、それがネットワークの他の部分へと派生して大規模通信障害へとつながっている。

  • 2021年10月に発生したNTTドコモの通信障害の概要。IoT回線向けの機器入れ替え時に不具合が判明し、元に戻そうとした際にIoT端末からの大量の位置情報登録が発生、輻輳を起こし大規模障害へとつながっていった

そうしたことから今回のKDDIの障害を受け、「NTTドコモの障害の反省が生かされていない」という論調も少なからずあるようだ。だがKDDIの発表内容を見るに、NTTドコモの障害を受けて同社もさまざまな対策を実施しており、それが功を奏した部分もある。

実際同社はIoT向けとコンシューマー向け、双方のネットワークの障害が影響を与えないよう切り離す措置を講じており、今回影響を受けたIoT向け回線は同社の約1500万回線のうち、最大でその10分の1となる約150万回線ほど。影響を受けた回線の多くはSMSなど音声通話の仕組みを利用したものだそうで、事前の対処によって実はIoT向け回線への深刻なダメージが避けられていることを忘れてはならないだろう。

他にもオペレーションの見直しや、輻輳時の制御手順の見直しや事前のシミュレーションなど、NTTドコモの障害を教訓として事前にさまざまな対策は打っていたという。だがそれらの策を講じてもなお、今回の障害に対処しきることはできなかったようで、今後の原因究明と、どのような部分の対処に不足があったのかという検証は必要になってくるだろう。

通信がより重要になる時代、個々の備えも重要に

だがNTTドコモがIoT回線、KDDIがVoLTEという比較的新しい仕組みで、短時間のうちに輻輳を発生させ大規模障害へとつながっている点からは、やはりモバイル通信のネットワークとその使われ方が高度化・複雑化したことで、わずかなトラブルがネットワーク全体に致命的な影響を与えるようになった様子が見えてくる。

実際、KDDIの取締役執行役員専務 技術統括本部長である吉村和幸氏は、2022年7月4日の記者説明会で「3G時代にここまで大きいの(通信障害)は聞いたことがない」と話していた。スマートフォン時代になってデータ通信と音声通話が一体化し、なおかつ常時システムにアクセスしネットワークに高い負荷をもたらしやすくなったことが、輻輳を起こしやすい状況を生んでいることは確かなようだ。

  • 2022年7月4日にオンラインで実施された記者説明会に登壇するKDDIの吉村氏(右)

だが今後5G時代に入れば、IoT向け通信がより拡大しネットワークに接続することが当たり前の時代となり、現在以上にネットワークへのアクセスは増え輻輳を起こす要因は増える一方だ。それはつまり、いつどの会社のネットワークで、大規模通信障害が起きてもおかしくない時代が迫っていることを示しているともいえるだろう。

そうした時に社会的影響を抑えるには、携帯電話会社の努力に依存するのではなく、より社会全体で通信障害をカバーできる仕組みの構築が求められるだ。実際今回の通信障害を受け、障害発生時に他社へローミングすることを求める声も浮上してきており、その実現に向けた議論を進めようとする動きも出つつあるようだ。

だがその実現には、ローミングを受けた先の企業が企業がトラフィックをどこまで許容できるのかという問題があるだろうし、日本では携帯電話会社に割り当てられた周波数がバラバラであるため、端末によっては周波数が一致せず他社回線にローミングできないケースが出てくる可能性もある。実現にはそうした問題を解決していく必要があり、相応の時間を要するのではないかと考えられる。

なのであれば我々がすべきことは、やはりネットワークの冗長化、要はバックアップのため複数の携帯電話会社の回線を持つことだ。複数の回線を持つにはとても金がかかるように思う人も多いだろうが、現在ではKDDIの「povo 2.0」のように月額0円から利用できるものもあるし、NTTドコモやソフトバンクの回線であれば月額1,000円以下、サービスによっては月額500円以下で利用できるMVNOのサービスを活用でき、低コストでバックアップ回線を持つことが可能だ。

  • HISモバイルの「自由自在290プラン」はNTTドコモ回線を利用しており、データ通信量100MB未満であれば月額290円から利用できることから、バックアップ用途にも適したサービスの1つといえる

スマートフォンの側も、最近ではiPhoneをはじめとして2つの回線を同時に使用できる「デュアルSIM」に対応したものが増えてきている。実はスマートフォン1台で、しかも低コストで複数回線を利用できる環境はかなり整備されてきていることは、もっと周知されて然るべきだろう。

さらに法人での利用であれば、なおさら事業の継続と信頼のためにもネットワークの冗長化は必須といえるだろう。通信障害が「起きてはならないもの」ではなく「起き得るもの」と捉え、各自が備えるという意識を持つことこそが、モバイル通信の社会的影響がより大きくなる時代に求められるのではないだろうか。