非構造化データをどう守るか——AI時代のデータセキュリティの新課題

執筆者:CEO 森田 俊哉

データの価値が向上しており、企業経営の意志決定プロセスにおいて、従来は経営層が直感的に経験則に基づいて意志決定していたのに対し、昨今のAIの進歩によってより精度の高い客観的なデータに基づく意志決定が可能となりました。

一方で、前回の私のブログでも書いたように、非構造のデータが全体の80%以上を占めるようになり、非構造データこそが増加するデータの主役となっています。

データベースに格納されるような構造データと異なり、SNSのテキストログや写真の他にもメール、チャット、動画、音声ファイル、PDFドキュメント、IoTセンサーのログ、監視カメラ映像など、多様な形式のデータが非構造化データには含まれます。

AIの進歩により、このような非構造化データそのものの経営価値が劇的に変わってきました。かつてこのようなデータは単なる記録媒体でゴミに過ぎませんでしたが、今ではAIや機械学習技術の発展により、このようなデータも企業の競争力を左右する最重要資産に位置付けられるようになりました。

前回のブログでも触れたように、企業のデータの80~90%が非構造化データであり、これらのデータにも膨大なビジネス価値が潜在していることが認識されるようになりました。

構造化データに限らず、そうした価値の高いデータほど、攻撃者にとっても魅力的なターゲットになります。データセキュリティの重要性は数十年前から叫ばれてきましたが、このように守るべきデータが非構造化データにまで拡がっても、データセキュリティは変わらず重要です。

なぜデータセキュリティが重要なのかについて、再度考えてみたいと思います。

1.規制環境の急速な強化

世界的な規制強化が、データセキュリティ重視を加速させた重要な要因です。2018年に欧州でGDPR(一般データ保護規則)が施行されたことは、ターニングポイントとなりました。GDPRは単なるEU域内の規則に留まらず、EU域内のデータを扱う世界中の企業に適用されます。違反時の制裁金は最大で年間売上の4%または2000万ユーロのいずれか高い方という厳しいものです。

これを機に、米国やアジア太平洋地域を含む世界各地で個人情報保護規制が急速に強化されました。グローバルに事業展開する企業は、複数の国・地域の規制に同時に対応する必要が生じました。

2.サイバー攻撃の質的・量的な悪化

サイバー攻撃そのものが進化しています。2025年の統計によれば、ランサムウェア攻撃は業種・規模を問わず企業に深刻な被害をもたらしています。

例えば、2025年9月に国内の大手メーカーがランサムウェア攻撃を受け、190万を超える個人情報の漏洩の可能性が指摘されました。また、商品受注・出荷システムの停止が2026年1月まで続くなど、事業活動にも大きな影響が出ました。

2025年10月には、やはりランサムウェア攻撃を受けたEC企業で基幹システムが暗号化され、物流システムが停止し、2026年2月にやっと復旧したのは記憶に新しいところかと思います。

このように、サイバー攻撃は単なる金銭的損失に留まらず、事業停止や顧客信用の失墜に直結しています。さらに、AI技術を悪用した高度な攻撃も増加しており、検知回避能力に優れたマルウェアやなりすまし精度の高いビジネスメール詐欺(BEC)が増加しています。

攻撃が成功する確率が高まれば高まるほど、防御側(企業側)はより強固なセキュリティ体制の構築を余儀なくされています。

3.非構造化データ時代の管理の複雑性

前半で触れた、非構造化データの急速な増加も重要です。非構造化データもAIの進歩により価値あるデータとして認識されるようになりました。

従来のリレーショナルデータベースに格納された構造化データであれば、比較的シンプルなアクセス管理やバックアップが可能でした。しかし、SNSログ、メール、画像、動画、IoTセンサーデータなど、多様な形式のデータが組織内に散在する現在、これらすべてを適切に保護することは格段に複雑になっています。こうした非構造化データも構造化データ同様にセキュリティ対応が必要となっています。


このように、データの種別や格納場所が変化しても、セキュリティは経営層が直接関心を持つべき戦略的課題となっています。

データが爆発的に増加し、非構造化データが大勢を占めるようになっても、データの価値向上、規制環境の厳格化、攻撃の高度化、経営リスク化、そしてデータ管理の複雑化という、複数の要因が相互に作用していることがデータセキュリティを複雑化していると言えます。

構造化データを格納しているデータベースであればアクセス制御やアクセスログ取得などの仕組みが組み込まれていましたが、非構造化データは、格納されるインフラが様々であり、画一的な仕組みを組み込むことは、非常に困難です。

AI活用のために機微な情報をマスキングなどでリスクを排除する「Security for AI」という新たなセキュリティ課題が出てきました。しかし、非構造化データのセキュリティを守るためには、「AI for Security」とでもいうようなAIを適用することで解決したいところです。

但し、AIは100%を保証出来るソリューションではありません。セキュリティだから100%防ぎたいという企業側の要求とどのように折り合いをつけるかが課題となると思います。しかしながら、この100%保証を求める余りセキュリティの実装が遅れてしまっては意味がありません。

私は、90%以上保証出来るのであれば、AIの他にもう1つの施策を同時に実装することで補完できるのではないかと思います。AIによって拡張されたデータの価値を守るのは、やはりAIであると言えます。

TOP インサイトブログ 非構造化データをどう守るか——AI時代のデータセキュリティの新課題

Recruit 採用情報

Contact お問い合わせ

  購入済みの製品サポートはこちら

製品サービス

自社開発製品群

データ統合

ディザスタリカバリ

プロフェッショナルサービス