データブリックス、リアルタイム分析基盤「Lakehouse//RT」を発表
データとAIのリーディングカンパニーであるデータブリックスが、米国時間の6月16日に新しいリアルタイム分析基盤「Lakehouse//RT」を発表しました。この新しいソリューションは、「Reyden」と呼ばれる最新のコンピュートエンジンを基にしており、Delta LakeとApache Iceberg™に適用されたデータに対するリアルタイム分析を直接実行できます。
Lakehouse//RTの誕生背景
これまで、多くの企業は高い同時接続数や低レイテンシーを必要とする際に、通常、レイクハウスと別にリアルタイムサービングレイヤーを構築せざるを得ませんでした。その結果、ベンダーロックインやインフラコストの増加、ガバナンスの複雑さなどの課題が生じ、企業は「高いレイテンシーか、データ基盤の分断か」という二択に悩まされてきました。特に、AIエージェントは、競争力を維持するために、リアルタイムでデータにアクセスし続ける必要があります。そのため、Lakehouse//RTは最新の技術を駆使してこれらの課題を解決することを目的に開発されました。
レイテンシーの削減とパフォーマンス向上
Lakehouse//RTは、数万人規模の同時接続ユーザーやエージェントをサポートしつつ、ミリ秒単位での応答を実現しています。具体的には、小規模なデータセットでは約10ミリ秒、大規模データセットでも100ミリ秒未満のレイテンシーで応答が可能です。これにより、ユーザーやエージェントは最新のデータに迅速にアクセスでき、ビジネスの意思決定を加速することができます。
統合環境でのデータ利用
さらに、Lakehouse//RTで行われるすべてのクエリは、最新の「Unity Catalog」によるガバナンスのもとで提供されます。これにより、別途ガバナンスレイヤーを維持する必要がなくなり、他のデータ資産との間での齟齬も解消されます。ユーザーは特定のテーブルを指定するだけで、数分以内にリアルタイムデータのクエリを開始できるため、煩雑なデータの移動やコピーが必要ありません。
お客様の反応と今後の展望
多くの企業でこの新しい技術を既に試しています。その中には、脅威情報の検索を担当するCiscoのChris Kopek氏がいて、彼は「Lakehouse//RTによって、ライブデータの応答時間が5倍改善され、昔のサービングシステムを維持する必要がなくなりました」と語っています。また、Magniteのエンジニアリング担当シニアディレクターKayvon Raphael氏も、この新システムがリアルタイムデータの提供に伴う複雑性を大きく削減できると評価しています。
結論
データブリックスの新たなリアルタイム分析基盤「Lakehouse//RT」は、高パフォーマンスとガバナンスが整った新しいデータの利活用を促進し、企業のデータ戦略を加速させることでしょう。たったの数分で最新データにアクセスできる環境が整い、これまでの問題を根本から解決します。この革新は、今後、デジタルトランスフォーメーションを進める多くの企業にとって、大きな変革をもたらすと期待されています。興味のある方は、ぜひデータブリックスの公式サイトをチェックしてみてください。