【KDDI通信障害】原因はコアルーター交換時の不具合とアクセス集中 負荷低減のため流量制御実施でつながりにくく 本格再開は未定 ★5
出典:@ishiit_aroka
KDDIの大規模通信障害、影響は最大3915万回線--事象が重なり復旧に遅れ
https://headlines.yahoo.co.jp/hl?a=20220703-35189873-zdnet-sci
KDDIは7月3日午前11時から、2日未明に発生した大規模な通信障害に関する記者会見を開いた。会見した代表取締役社長の高橋誠氏は、「社会インフラを担う安定的なサービスを提供しなければならない通信事業者として深くお詫びする」と謝罪を表明した。
通信障害は7月2日午前1時35分に発生し、全国で通話ができない、SMSの送受信ができない、データ通信の速度が遅くなる、途切れるなどの状態が3日午後現在まで続いている。3日午前11時時点の同社想定による影響範囲は、最大で約3915万回線。
中略
同社は、障害発生後から対応と復旧の作業を進めており(後述)、西日本エリアでは3日午前11時頃に、東日本エリアでは午後5時半頃に復旧作業の完了を予定。ただし、本格的な再開はネットワーク試験の検証結果によるとして未定という。
■複数の事象が重なり、復旧遅れる
同社によると、今回の障害は、東京・多摩ネットワークセンターで行っていたモバイルコアネットワークのコアルーター交換に起因する。通常保守の一環として2日午前1時35分からコアルーターのリプレース作業を行ったところ、新しいコアルーターで原因不明の故障が発生、音声トラフィックの通信経路が変更されず、約15分間に渡ってVoLTE(Voice over LTE)の音声通信が断絶、VoLTE交換機からアラートが発生した。この作業は外部委託ではなくKDDIが実施していたという。
このため午前1時50分に、手順に従って古いコアルーターへの音声トラフィックの切り戻し作業を実施。午前2時に事故対策本部を立ち上げた。しかし、午前2時17分頃から切り戻しに伴うアクセス集中によって、VoLTE交換機で輻輳が発生した。同社は午前2時52分にウェブサイトで障害情報を公開した。
午前3時から午後3時22分の約12時間にわたり、VoLTE交換機の負荷を低減するため、契約者端末からの信号接続要求の流量を制限。VoLTE交換機での呼処理プロセスのリセットと流量制限、無線設備でのデータおよび音声の接続要求の流量制限も実施した。
しかし、午後3時22分から加入者データベース(DB)の処理負荷が増加したという。取締役執行役員専務 技術統括本部長の吉村和幸氏によると、通常は契約者が通話やデータ通信をしていない状況でも端末と通信設備との間で、50分に1回の頻度で通信を行い、その際に位置情報を加入者DBに登録している。加入者DBでの処理後にVoLTE交換機にも位置情報が反映され、これがそろっていることで正常な通信が行われるという。
加入者DBの負荷の高まりは、上述のVoLTE交換機の負荷を軽減する各種作業の影響で、加入者DBへの位置情報の登録処理が不安定になったことが原因という。このため同社は、西日本収容の2台のパケットデータネットワークゲートウェイ(PGW)と東日本収容の2台のPGWを切り離し、加入者DBの負荷低減策を講じた。
さらに午後5時22分には、加入者DBに登録されるデータの不一致が発生した。今度はこれを修正する必要があり、先に切り離した東西日本収容の4台のPGWについてセッションをリセットしてデータの不一致を修正。その後に、別のPGW(計13台)についても切り離しとセッションのリセットを行ったとしている。
記者会見の時点で、障害発生のきっかけと見られるコアルーターの故障原因は調査中という。輻輳の発生による通信障害についても、事前の想定を超える事象が重なったことにより、復旧作業を手順通り実施したにもかかわらず復旧が長期化していると、同社では説明している。…
全文はソース参照
【写真】最初に発生した障害の概要。コアルーターを旧製品から新製品へ交換したところ何らかの不具合が発生した(日経クロステック)
【写真】コアルーターの切り戻し後に起きた障害の概要。VoLTE交換機へのアクセスが集中し、さらに加入者データベースのデータにも不一致が発生した(日経クロステック)
※前スレ
ネット民のコメント
不具合の原因が不具合って、そりゃ原因わかってないって事だろ。
何を隠してるんや?
今も復旧しないのは、制限かけてるとかテストしてるとか、そんなありきたりな嘘がいつまでもつと思ってるんや嘘ついて隠してその場しのぎ出来ると思っとりますか?
繋がりませんよアクセス集中が主因の一部のような言い分
集中させたくないなら顧客数減らせばいいのではアクセス集中に伴う輻輳なら時間とともにもうとっくに解消してるやろと
そうじゃないんだろ?
消しちゃいけないものを消しちゃてバックアップからでは戻せないんだろ?太陽フロアは無関係?
クレーマー多すぎだろw
・月1000円あれば他会社のサブ回線持てる時代に、サブ用意してないんだから、お前の用事は1日約30円の価値もないってことでしょ?
反論できるやついる?
電話できないなら家電話使え。公衆電話使え。友達のドコモやSBの電話貸してもらえ。
つか、この個人情報の収集って必要?
>通常は契約者が通話やデータ通信をしていない状況でも端末と通信設備との間で、>50分に1回の頻度で通信を行い、その際に位置情報を加入者DBに登録している。コアルータを壊して代わりを手配しようにも担当者がau使ってたら連絡取れなくて手詰まりってことなんだろ。
>しかし、午前2時17分頃から切り戻しに伴うアクセス集中によって、VoLTE交換機で輻輳が発生した。
コレは「アクセス集中」とは違わなくね?
「アクセス集中」って言うとユーザー側がやってるみたいじゃん社長、いつ復旧するんですか?(利用者の悲痛な叫び)
単純明快だ
囲い込みのため、格安SIMで値段下げる、使いたい放題を安く使わせる準備ができていない。加入者データベースの不一致を分かりやすく例えると肉体は男なにに心は女~みたいな状態か。
緊急連絡は出来るドコモの契約切れてるSIMカードのほうが心強いわ。しかも、エリアメールも来るのよ。
ネットワーク関係ではpingをピングと読み続けているし、そんな業界なんですよ。香港をホングコングって言ってるのと同じなんだが変わらないw
専門の詳しい人間は働き方改革で土日休みだったから月曜日になれば出社してくるだろうとうと信じてる頑張れau
電車の振替輸送じゃないが適切な場所まで運ぶべき このまま復旧作業完了とか何やかんや言いながら客を立ち往生させてはならない
庵野秀明がダイコン3で大成功してしまったから、対抗してアニメ作ろうとしたけど出席が足りず学校に何度も呼び出されて、文化祭当日なのにまだアニメが完成してないって感じ
予想するに3G設備撤去しようとして通話関係の機器を物理的に破壊しちゃったんじゃね、当然そんな作業想定してないから予備パーツも準備してない、慌ててパーツ手配しようとしたけど携帯不通で担当者捕まらないとかじゃね、土日は休みだしな。
へ~。こういうメンテや管理保守は専門業者を雇ってると思ったが、自前の部隊を持ってるんだね
学習とか伝播みたいなラグでもあるの?設定飛んじゃったどころかバックアップしてなかったとかじゃないの?
それこそネタで原発事故に例える事はあっても、ネットワークの復旧作業でそんな人海戦術みたいなことやるわけないし、現地でハードの復旧作業してんのは下請けの作業員なんだけどw
確かauのシステムは自動化されてて不具合起きてもバックアップに切り替わるって自慢してたはずなんだが。
この国は本当に”守る”ことは苦手なんだろうと思われるぜ。9条で平和とかカネ払っているから大丈夫とかさ
なんつーか、この「完了」という言葉の定義が通信事業者と通信事業者以外の国民とで異なるんだろうな。