データファブリックの啓示 – GigaOm

グアダラハラ - アメリカ January 15, 2025

「データファブリック」という用語はテクノロジー業界全体で使用されていますが、その定義と実装はさまざまです。私はこれをすべてのベンダーで見てきました。昨秋、ブリティッシュテレコム (BT) はアナリストイベントで自社のデータファブリックについて話しました。一方、ストレージ分野では、NetApp はブランドをインテリジェントインフラストラクチャに向けて再調整していますが、この用語は以前から使用されていました。アプリケーションプラットフォームベンダーの Appian にはデータファブリック製品があり、データベースプロバイダーの MongoDB もデータファブリックや同様のアイデアについて話しています。

データファブリックの核心は、異種のデータソースを要約および統合してシームレスなデータレイヤーを作成する統合アーキテクチャです。原則は、異種のデータソースと、データへのアクセスが必要なワークロード (アプリケーション、ワークロード、さらには AI アルゴリズムや学習エンジンなど) の間に統合された同期レイヤーを作成することです。

このようなオーバーレイが必要になる理由はたくさんあります。 Data Fabric は、汎用化された統合レイヤーとして機能し、さまざまなデータソースを接続したり、アプリケーション、ワークロード、モデルへのアクセスを容易にする高度な機能を追加したりすることで、同期を維持しながらこれらのソースにアクセスできるようにします。

ここまでは順調ですね。ただし、課題は、データファブリックの理論と実際の実装の間にギャップがあることです。人々はさまざまなことを表すためにこの言葉を使用しています。 4 つの例に戻ります。

BT は、データファブリックを、長距離にわたるデータ送信を最適化するために設計されたネットワークレベルのオーバーレイとして定義します。
NetApp の説明 (インテリジェントデータインフラストラクチャという用語も使用) では、ストレージの効率性と集中管理が強調されています。
Appian は、自社のデータファブリック製品をアプリケーション層でデータを統合するツールとして位置づけ、ユーザー向けツールの迅速な開発とカスタマイズを可能にします。
MongoDB (およびその他の構造化データソリューションプロバイダー) は、データ管理インフラストラクチャのコンテキストでデータファブリックの原則を考慮しています。

これらすべてにどう対処すればよいでしょうか?答えの 1 つは、さまざまな角度から見ることができることを受け入れることです。データソースを統合する必要性を認識しながら、誇張せずにデータファブリックについて概念的に語ることができます。完全にすべてをカバーする普遍的な「超ファブリック」は必要ありません。代わりに、管理する必要がある特定のデータに焦点を当ててください。

数十年を振り返ると、サービス提供をデータベースシステムから分離することを考慮したサービス指向アーキテクチャの原則との類似点が見られます。次に、サービス、プロセス、データの違いについて説明しました。同じことが引き続き当てはまります。ワークロードに必要なものに焦点を当てて、サービスをリクエストしたり、データをサービスとしてリクエストしたりできます。作成、読み取り、更新、削除は最も単純なデータサービスです。

また、ネットワークアクセラレーションの起源を思い出しました。これは、ソースに繰り返しアクセスするのではなく、データのバージョンをローカルに保持することで、キャッシュを使用してデータ転送を高速化するものでした。 Akamai は、音楽や映画などの非構造化コンテンツを長距離にわたって効率的に転送する方法を中心にビジネスを構築しました。

これは、データファブリックが車輪の再発明を行っているという意味ではありません。私たちは技術的に異なる (クラウドベースの) 世界にいます。さらに、特にメタデータ管理、系統追跡、コンプライアンス、セキュリティ機能など、新しい側面ももたらします。これらは、データガバナンス、品質、来歴がモデルのパフォーマンスと信頼性に直接影響を与える AI ワークロードにとって特に重要です。

データファブリックの導入を検討している場合、最適な開始点は、データが何のために必要なのかを考えることです。これは、どのタイプのデータファブリックが最適かを知るのに役立つだけでなく、世界中のすべてのデータを管理しようとするという罠を回避するのにも役立ちます。代わりに、最も価値のあるデータのサブセットに優先順位を付けて、データファブリックのどの層がニーズに最も適しているかを検討できます。

ネットワークレベル: マルチクラウド、オンプレミス、エッジ環境全体でデータを統合します。
インフラストラクチャのレベル: データがストレージベンダーで一元化されている場合は、一貫したデータプールを提供するストレージレイヤーに焦点を当てます。
アプリケーションレベル: 特定のアプリケーションまたはプラットフォーム用にさまざまなデータセットをまとめる。

たとえば、BT の場合、データファブリックを使用して複数のソースからのデータを統合することに本質的な価値があることがわかりました。重複を減らして業務を合理化し、データ管理をより効率的にします。これは明らかに、サイロを統合し、アプリケーションの合理化を改善するのに役立つツールです。

結局のところ、データファブリックはモノリシックな、万能のソリューションではありません。これは、製品と機能によってサポートされる戦略的な概念レイヤーであり、柔軟性を高め、データ配信を改善するのに最も合理的な場合に適用できます。デプロイメントアーキテクチャは、「設定したらあとは忘れる」というものではありません。そのスコープ設定、デプロイメント、およびメンテナンスには、ソフトウェアだけでなくデータソースの構成と統合も含めた継続的な取り組みが必要です。

データファブリックは概念的には複数の場所に存在できますが、配布作業を不必要に重複させないことが重要です。したがって、ネットワーク全体、インフラストラクチャ内、またはアプリケーションレベルでデータを収集する場合でも、ニーズに最も適した場所でデータを使用し、提供されるデータに応じて拡張できるようにするという原則は変わりません。

「データファブリックの謎を解く – データソースとワークロードの間のギャップを埋める」という記事は、最初に Gigaom に掲載されました。

グアダラハラ – アメリカ

グアダラハラ – アメリカ

データファブリックの啓示 – GigaOm

LEAVE A RESPONSE Cancel reply

グアダラハラ - アメリカ

スタートレックボイジャー: 未知の世界へのリリースカウントダウン – 正確な日付と時刻

減量競争: 注射から錠剤への切り替えが大手製薬会社の希望をいかに高めているか

2026 年冬季オリンピックのスケジュール: 米国女子ホッケー準決勝のミラノコルティナ大会をどこで観戦できるか

ウィニペグ・ジェッツのヘレバイクは「世界最高のゴールキーパーの一人」と米国オリンピックチームメイトのCBCスポーツが語る

Recent Posts

Recent Comments

Archives

Categories

データ ファブリックの啓示 – GigaOm

LEAVE A RESPONSE Cancel reply

グアダラハラ - アメリカ

You Might Also Like

スタートレック ボイジャー: 未知の世界へのリリースカウントダウン – 正確な日付と時刻

減量競争: 注射から錠剤への切り替えが大手製薬会社の希望をいかに高めているか

2026 年冬季オリンピックのスケジュール: 米国女子ホッケー準決勝のミラノ コルティナ大会をどこで観戦できるか

ウィニペグ・ジェッツのヘレバイクは「世界最高のゴールキーパーの一人」と米国オリンピックチームメイトのCBCスポーツが語る

Recent Posts

Recent Comments

Archives

Categories

データファブリックの啓示 – GigaOm

スタートレックボイジャー: 未知の世界へのリリースカウントダウン – 正確な日付と時刻

2026 年冬季オリンピックのスケジュール: 米国女子ホッケー準決勝のミラノコルティナ大会をどこで観戦できるか