NTT西日本ひかり電話輻輳

今年の3月31日(金曜日)、4月21日(金曜日)に続いて3回目です。

NTT西日本IP電話サービス、「ひかり電話」と企業向けの「ひかり電話オフィスタイプ」で、23日9時35分頃から電話がつながりにくい状態となった。
不具合の範囲は、静岡県から沖縄県までの2府28県、法人・個人の約832,000件に及んでおり、NTT西日本の「ひかり電話」の通信障害としては過去最大規模。
ひかり電話」を巡っては、9月19日にNTT東日本で通信障害が発生し、約80万件に影響が出ている。
(2006年10月23日=Yomiuri On Line)

<2006年10月24日追記>

10月23日に、「ひかり電話」をご利用のお客様の通話で、つながりにくい状況が再度発生し、多大なご迷惑をおかけしたことを深くお詫び申し上げます。

  1. 発生日時
    • 2006年10月23日(月曜日)9時35分頃
  2. 対応事象
    1. 発生状況
      • この度の事象は「ひかり電話」「ひかり電話オフィスタイプ」の通話を制御する呼処理サーバに大きな負荷がかかり、混み合った状態となったことから、「ひかり電話」サービス全体の安定化のため通話量を部分的に制限したことにより、「ひかり電話ビジネスタイプ」を含む全ての「ひかり電話」サービスに影響を与えた。
    2. 影響を受けたNTT西日本エリアの「ひかり電話(オフィスタイプ、ビジネスタイプ含む)」の顧客数
      • 約833,000契約
    3. 対応状況
      • 10月23日23時50分:負荷がかかった呼処理サーバへの接続制御を行った上で装置の再立上げを実施した後、接続制御を解除。
      • 10月24日09時06分:呼処理サーバに昨日と同様の大きな負荷がかかる兆候があったので、接続制御を実施。
  3. 故障原因
    • 呼処理サーバの容量を超えたトラヒックが流れたため、輻輳が発生し、そのため中継系呼制御サーバに影響を与えた。
  4. 今後の措置
    • 明朝を目処に呼処理サーバを増設し処理能力を向上させる。
    • 呼処理サーバ増設までは、呼の疎通を図るため、トラヒック監視を充分に行い、必要に応じ制御を実施する。
    • その後、NTT西日本の「ひかり電話」ネットワーク全体の処理能力を再チェックする。

(2006年10月24日=NTT西日本

NTT西日本は、24日9時過ぎから、電話サービスで、23日に続いて発着信規制を実施した。この結果、同社のIP電話の全回線(静岡県以西2府28県)に当たる833,000回線で電話がつながりにくい状態となっている。
23日朝から起こった大規模通信障害は24日1時頃、いったん完全復旧した。しかし、障害の原因がわかっていないことから、サーバーに負荷がかかりすぎる事態を防ぐため、NTT西日本は24日も発信は4回に1回しかつながらず、着信も最大で95%ができないように通信規制をかけている。
(2006年10月24日=Yomiuri On Line)

<2006年10月25日追記>

NTT西日本は25日8時30分頃から、IP電話サービスで通信規制を実施した。規制は3日連続となり、静岡県から沖縄県まで2府28県の全833,000回線で、発信の25%、着信の50〜95%がつながらない状態となっている。
23日朝に発生した通信障害は、24日22時20分過ぎにいったん復旧。25日6時までに通信処理サーバーを1台増設したが、その後、通話が集中して新サーバーに負荷がかかりすぎた。
(2006年10月25日=Yomiuri On Line)

<2006年10月26日追記>

昨日22時7分に「ひかり電話」等の通話の規制を解除し、システムの安定的な運用を確認しておりましたが、本日9時45分現在も「ひかり電話」等に関する通話は安定しております。
(2006年10月26日=NTT西日本

<2006年10月27日追記>

23日の障害の原因は,毎秒140程度の同時通話に耐えられるよう設計していたはずが、実際には毎秒120程度までしか耐えられなかったこと。同時通話が120以上発生した時点で呼処理サーバーが輻輳。次いで中継系呼制御サーバーにも影響が波及した。翌24日も,通常の火曜日より多い呼処理があり、輻輳が再発した。NTT西日本によれば、前日に利用できなかったユーザーが通話を試みた結果、普段より呼が増えた可能性が高いという。
25日は,中継系呼制御サーバーと加入電話網側の中継交換機を接続する回線に設定した通話規制が裏目に出た。接続できる回線数を減らした結果、ひかり電話加入電話着の呼と、加入電話ひかり電話着の呼が回線空きの待ち状態が発生。空いた回線に、中継系サーバーと中継交換機の双方から接続しようとする呼が集中して衝突する事態が多数発生。これが中継系サーバーの処理負荷を増大させた。
(2006年10月27日=NIKKEI BP ITpro)