ドコモ“他人のメアドになる”不具合は解消、10万人に影響


 NTTドコモは、20日に発生したspモードメールの不具合について、同日18時におおむね解消したと発表した。ただし、念のためにシステムの再起動を行う予定で、同社では22日午前を目処に不具合の完全復旧と見なす。あわせて一時停止したサービスは、明日午前の完全復旧時にあわせて再開される。

事象の内容

 影響を受けたユーザーは、約10万契約。その多くが関西のユーザーと見られているが、詳細は調査中。21日7時半時点でのユーザーからの申告件数は108件。前日夜には119件の申告とされていたが、集計途中の計算に誤りがあり、実際の申告は108件とのこと。

 事象としては、spモードメールの一部ユーザー(Aさん)のメールアドレスが、実在する全くの他人(Cさん)のメールアドレスに置き換わってしまうことがあり、その際、友人(Bさん)にメールを送ると、友人の手元にはメール本文はそのままながら全くの他人のメールアドレスから送信されたように見える。Bさんが返信すると、Aさんではなく、Cさんのメールアドレス宛てに送信され、Cさんに届いていた。一方、単なる返信ではなく、Aさんのメールアドレスをアドレス帳などから指定してメールを送るとAさんにはきちんと届いたという。

Aさん、Bさん、Cさんの関係で示した今回の事象

 影響を受けた約10万人という数は、Aさん、Bさん、Cさんのうち、Aさんだけの数。その他のBさん、Cさんに該当するユーザーは今後1週間を目処に特定される。

 20日23時に本事象の発表が行われた際には、電源のOFF/ONという再起動で回避できるとされていたが、spモードメールでは、1時間に1回、メールアドレスを付与し直す仕組みになっているとのことで、影響を受けたユーザーについても、この自動補正機能により20日18時ごろには正常な状態になったと見られている。事象解消を確実なものにするため、ドコモでは、全てのspモードユーザーへ端末再起動を行うよう呼び掛けるとともに、ネットワーク側でも明日の午前中までにパケット交換機をリセットする。

 なお、iモードメールへの影響はない。

不具合の経緯

 今回の事象は、20日12時22分に関西地区で発生した、中継伝送路の障害がきっかけとなった。この障害は、2系統ある光回線のうち一方をメンテナンスしている最中に起きたもので、もう一方が予備回線となっていたにも関わらず、光ケーブルが曲がるなど何らかの原因で通信ができなくなった。全ての通信が絶たれた状況(全断)だったが、2分で回復した。この2分間で通信できなくなったスマートフォンが、一斉に再接続の要求を実施。その処理を受け付けるユーザー管理サーバーが“輻輳(ふくそう)”と呼ばれる、処理が滞る状態に陥った。

 輻輳状態を解消するため、ドコモでは通信規制を実施し、12時22分~14時25分まで全国でspモードメールが利用しづらい状況となった。輻輳は14時25分で解消されたものの、ユーザー管理サーバーでの輻輳が原因で、インターネットを利用するために必要なIPアドレスと、ユーザーの電話番号/メールアドレスを紐付ける処理がうまくいかず、今回の事象が起きた。

 原因となった中継伝送路の障害そのものは、ドコモにとってあってはならない障害ではあるが、ドコモでは「ハードは壊れるもの」という前提に立って、ネットワークで問題が起きても、システム側で吸収できるようにしてきた。しかし、ユーザー管理サーバーは輻輳を起こしてしまった。

 輻輳が起きたのは、再接続要求が急激に増加し、負荷がかかったため。ドコモでは、今年8月、通信設備の故障によりspモードの通信障害を起こしており、再発防止のため、サーバーの処理能力を増強していた。20日に急増した再接続要求の量は、その増強した処理能力を持ってすれば処理できる規模だったにも関わらず、輻輳が起きた。そこでドコモでは、ユーザー管理サーバーが今回の事象の大きな原因と見ており、当面はサーバー能力の最適化を図る。

spモードの仕組みと不具合の流れ

 技術的な視点で見ると、spモードのシステムは認証を行う「ネットワーク認証サーバー」、接続状態を管理する「セッション管理サーバー」、ユーザー情報を管理する「ユーザー管理サーバー」で構成される。ユーザーの手元にあるスマートフォンは、このシステムに無線基地局、パケット交換機を通じて繋がる。

 インターネットを利用するためにはIPアドレスが必要だが、ドコモのネットワーク内でスマートフォンは電話番号で管理されている。スマートフォンがインターネットを利用する際には、IPアドレスと電話番号を紐付ける処理が行われる。手順としては、スマートフォンがパケット交換機とネットワーク認証サーバーにそれぞれリクエストを送り、サーバー側では割り当てても良い複数のIPアドレスをリストアップ。パケット交換機で割り当てるIPアドレスが決まり、「このユーザーの電話番号には、このIPアドレス」というように紐付ける。このIPアドレスは同じものを使い続けることもあれば、違うIPアドレスが割り当てられることもある。

spモードシステムの概要IPアドレスと紐づけ処理の流れ

 今回は、中継伝送路の障害をきっかけにしたユーザー管理サーバーで輻輳が起きて、通信規制を行うため、パケット交換機において「スマートフォンとネットワークはそれぞれ、今まで使っていたIPアドレスを手放してください」という処理が行われた。ところが、輻輳を起こしていたユーザー管理サーバーでは、このIPアドレスの解放という処理がうまくいかなかった。それまでAさんが使っていたIPアドレスは、Aさんと関係ないIPアドレスになるはずだが、輻輳によってユーザー管理サーバーは「まだAさんが使っているIPアドレス」と認識したままになっていた。

 そこへ、別のユーザーがIPアドレスの割当を求めた。システム側では、それまでAさんが使っていたIPアドレスを、新たなユーザーに割り当てることを決定する。しかしユーザー管理サーバーは依然として「このIPアドレスはAさんが使っている」としたままで、同じIPアドレスがかぶった状態で使われてしまい、「他人のメールアドレスに置き換わる」ことになった。

スマホ急増が一因、今後の対策

ドコモ辻村氏(左)

 21日の会見では、NTTドコモ代表取締役 副社長の辻村清行氏が説明を行った。同氏は冒頭、「本来は社長の山田(隆持氏)が説明すべきだが、現在、インドへ出張している。緊密に連絡をとって、復旧やユーザーへの対応に全力を挙げている。ご迷惑をおかけし、ご心配をおかけしたことを深くお詫び申し上げます」と謝罪した。

 メールアドレスが置き換わり、そのまま返信すると他人へ届いてしまうという状況から、個人情報の流出、あるいはIPアドレスを使ったコンテンツ課金システムなどでの誤課金の可能性がある。ただし、そうしたユーザーへの影響の程度は調査中とのことで、21日の段階では明らかにされていない。

 辻村氏は「電源のOFF/ONで回避できる、ということでもっと早く説明すべきという考え方もあるが、事象の概要を把握せずにどこまでお話しできるか、ということで、このタイミング(21日午前)になった。ご理解いただきたい」と説明し、まずは手持ちの通信のログデータを解析し、被害を受けたユーザーの特定を急ぐ方針を示した。この作業には1週間程度かかる。さらに応急的な対処法として、ユーザー管理サーバーが本来の能力を発揮できるようチューニングを施すほか、スマートフォンへIPアドレスを割り当てる際の手順(プロトコル)の改善を図る。

 辻村氏は、「今回の事象は、スマートフォンが常にインターネットへ繋がる、常時接続という特性を持っていたことが背景。特にAndroidはそうした面が強い」と述べ、スマートフォンの急増が影響したとの見方を示す。一方、そうした特性を理解した上で、ドコモではスマートフォンの導入を進めており、常時接続を要求するスマートフォンに耐えられるネットワーク作りは当然であり、年末年始の「おめでとうコール」「おめでとうメール」を含め、今後のトラフィック急増に耐えられるネットワーク作りに注力するとした。そのため、2015年度に4000万台とする、同社のスマートフォンの販売計画についても、影響を見極める必要はあるとしつつも、見直しは行わない方針とした。

 


関連情報


(関口 聖)

2011/12/21 19:32