AI時代のデータベースの行方

データベースと聞いてどのようなイメージをお持ちでしょうか?

データベースとは、「多くのデータを、後から探したり使ったりしやすい形で、整理して保存した仕組み」 または、構造化されたデータを永続的に保持し、DBMS(データベース管理システム)を通じて、整合性・可用性・性能を担保しながら操作できるデータ集合といったところでしょうか。

インサイトテクノロジーは、1995年の創業当初からデータベースを事業の中心とする会社です。30年にわたってデータベースの変遷を見つめてきました。

1990年代は、クライアントサーバの時代でデータベースは、IT業界でも中心的な役割を担ってきました。
2000年代に入り、Webシステム(3層構造)〜インターネット時代となりましたが、データベースはデータ量の飛躍的な増加に伴ってより重要性が増しました。
2000年代後半には、Web2.0となりSNSやブログが普及。
2010年代に入り、いよいよ仮想化技術が成熟し、クラウドコンピューティングが一般的になり、ビッグデータ時代へ推移しました。
2020年代には、DX(デジタルトランスフォーメーション)が叫ばれるようになります。
ここまでの時代の変化の中でも、まだまだデータベースの担うポジションは、大きかったと思います。

しかし、近年、いよいよAI/機械学習が実用化され、ITの重要な役割が判断・予測の自動化や人の意志決定を補助・提案するものに変わってきているのは、皆さんも感じられていると思います。AI/機械学習が注目されてデータベースの話が聞かれなくなったように感じますね。

データベースは、IT業界での重要なポジションを失ってしまったのでしょうか?
冷静に考えると、データベースはAIに置き換えられる基盤ではありません。明確に役割が異なるといえます。

データベース(RDBMS)は、以下のような機能を提供します。

  • 完全に決定論的
  • ACID特性による整合性保証
  • 監査可能・再現可能

一方でAI(特に生成AIや大規模言語モデル)は、本質的に以下の特性を持ちます。

  • 確率的出力(同一入力でも結果が変わる)
  • 推論過程がブラックボックス
  • 学習データ依存・ドリフトの発生

データベースは事実を保証し、根拠を持って答えを返すのに対して、AIは判断の材料を提供しますが「なぜそうなったのか?」という根拠を求めることが難しいと言えます。

ここまでくると、AIが全てを解決できるソリューションではなく、結果責任は人間にあることがおわかりいただけると思います。

以下の領域では、データベースをAIに置き換えられません。

  • 金融取引
  • 受発注・在庫管理
  • 契約・権限・課金
  • 公共・規制産業の基幹系

理由は明確で、

  • 1件の誤りが致命的
  • 説明責任・法的責任が必須

このため、AIは「補助・提案」段階までの活用にとどめ、最終的な状態遷移は必ず人間が確定する必要があります。また、アクセス制限や監査といったデータガバナンス領域や結果説明といった部分も、現在のAIにはまだまだ対応できないところです。将来的にこの辺りにも対応できるようになると、AIの適用範囲は飛躍的に拡がっていくでしょう。

とは言え、2024年のdb tech showcase*のオープニングセッションでもお話ししましたが、今まで活用できなかった非構造化データが、AIによって活用できるようになったのは大きな変化と言えます。

*インサイトテクノロジー主催の年次カンファレンス

さて話をデータベースに戻しますと、以前より大きくなったとはいえ、非構造化データのデータ量と比較して既存のデータベースが扱うデータ量はまだ多いとは言えません。今後生成されるデータの80%が非構造化データであると言われており、そのデータ量の成長率も年間60%前後で増加すると予測されているのに対して、構造化データでは10%程度と予測されています。

しかし、前述したような整合性やガバナンスといった観点から、データベースが担う役割は依然として非常に大きいままです。特に、金融や流通、通信など社会的に欠かすことのできない重要な役割をデータベースが担っていることから、2020年代に入っても企業のIT投資の60%が構造化データを扱う処理に費やされているとも言われています。とはいえ近年はAIの進化もすさまじく、今までのシステムでは対応できなかった汎用的な役割を担うようになってきたため、その状況にも少し変化が出ています。

一方でデータベースも進化しています。クラウドという拡張性の高いインフラを得ることで、システム運用者に負荷を掛けることなく多数のサーバで分散処理を行うデータベースも登場しています。多数のサーバを用意して同時に稼働させるHadoopなどの基盤は非常に運用管理負荷が高く、一般的になったとは言えませんでした。しかし、クラウドが登場することで、容易に分散データベースを使用することができるようになったのです。

例えば、2021年のdb tech showcaseでご登壇いただいたPingCap社が提供しているTiDBなどは、PayPayという誰でも知っているような金融基盤で使用されています。優れた拡張性に加え、従来の分散データベースでは困難だった整合性を実現しています。クラウドという基盤を手に入れたデータベースは、従来では実現できなかった大規模な基盤を提供するとともに、データベースの中に生成AIを取り込むことで、SQLが不可欠だったところから自然言語による処理が可能になるといった進歩をしていきそうです。30年にわたってデータベースに関わってきた身として、この先のデータベースの進化も楽しみです。

AIの台頭によりデータベースが不要になるという言説を聞いて不安を感じたことがあるエンジニアの方もいることと思いますが、AIとデータベースでは果たす役割が大きく異なります。データベースが役割を終えることは、まだ暫くはなさそうです。

TOP インサイトブログ AI時代のデータベースの行方

Recruit 採用情報

Contact お問い合わせ

  購入済みの製品サポートはこちら

製品サービス

自社開発製品群

データ統合

ディザスタリカバリ

プロフェッショナルサービス