ニュース
NTT、データ分析を最大73倍高速化する情報選択AIアルゴリズム群「高速スパースモデリング技術」を確立
1カ月以上かかる大量のデータ分析を1日以下で可能に
2025年9月10日 06:00
NTT株式会社は9月8日、大量のデータから重要な情報を選択するデータ分析を従来アルゴリズムと比較して最大73倍高速化する情報選択AIアルゴリズム群「高速スパースモデリング技術」を確立したと発表した。同アルゴリズム群の一部は、NTTドコモビジネス株式会社が提供するノーコードAI開発ツール「Node-AI」で利用可能。
スパースモデリングは、大量のデータから重要な情報を選択する分析に広く用いられる学習型の技術。この技術では「得られた情報の中でも必要なものはごく一部で、その他の大部分は不要である」というスパース(sparse:まばら)性を仮定することにより、大量のデータから重要な一部の情報を選択する。
しかし、データが膨大になるほどスパースモデリングの処理時間も長くなり、現実的な時間内でデータを分析することは難しくなる。この分析時間の短縮のために、一部のデータのみを使用するといった対策を取られることもあるが、この場合は分析されない「遊休データ」が生まれてしまい、重要な知見を見逃してしまうリスクになるという。
従来手法と比べて最大73倍高速化した「高速スパースモデリング技術」のポイントとして、下記の3つの内容が挙げられている。
1. スパースモデリングによる分析を最大73倍高速化
スパースモデリングにおける、「必要な情報はごく一部である」というスパース性の仮定を生かし、不要な情報に対応する計算を安全にスキップして枝刈りする独自のアルゴリズムを導入することで、従来のアルゴリズムと比較して最大73倍の高速化に成功した。
2. 従来技術から精度劣化しないことを理論保証
従来技術では、各情報の重要度を計算し、それが閾値以下であればその情報は重要でないと判定していた。高速スパースモデリング技術では、それぞれの情報の重要度の上界(取り得る値で最も高い値以上の数値)を判定に使用し、閾値以下であれば枝狩りを行い計算をスキップすることで、計算を高速化する。
ここでは、従来技術において不要な計算のみをスキップして枝刈りするため、従来技術と比較して精度が劣化しないことを理論的に保証可能だという。
3. 実用的なデータ形式を網羅
通信網の通信データはネットワーク構造形式、地域別交通量データはグループ構造形式、ECサイトの商品データは商品分類の階層(木)構造形式といった異なるデータ形式を有している。データ自体に加えて、このような構造情報を利用することで、よりA多様なドメイン特化型の分析精度の向上を期待できる。
同社は応用例として、製造分野においてプラントに設置されたセンサーから得られる時系列データから、プラントの生産の増減要因を推定する「生産効率最適化」を挙げている。同技術により、生産量に影響した時刻を時系列データの中から特定することで、その時刻でどのような操作が行われていたか、などの状況を調べる糸口となり、より生産効率を高める制御操作の検討や策定を期待できるという。
センサーからのデータ取得期間が長くなるほどデータ量は増加し、それが数万~数億時刻分のデータになると、一般的なコンピューターで1カ月以上の分析時間を要する場合がある。高速スパースモデリング技術を使用することで、この分析時間を1日以下へ短縮できるケースもあるという。
このほかの応用例として、医療分野において特定の病気の遺伝的要因の推定を行い新薬や治療法開発にその分析結果を役立てる、マーケティング分野において顧客の購買行動から特徴的な行動を推定し広告やクーポンの最適化に役立てる、エネルギー分野において核融合炉のセンサーデータからプラズマの挙動を表す方程式を推定し核融合炉の安定稼働のための制御操作策定に役立てる、などが挙げられている。
同社は「高速スパースモデリング技術」の実用化を推進するとともに、高精度化や省メモリ化といった高度化に向けた研究開発を推進することに加えて、大量データの分析が不可欠な核融合などの自然科学分野への適用など、多様な応用に取り組んでいくとしている。