Agile育成ブログ
未来を変える喜びを
未分類

AtScale

データとBIツール(Tableau、Excelなど)の間に位置する「仮想セマンティックレイヤー」を提供するSaaS

💡 AtScaleの役割:データ保存ではなく「データの橋渡し」

AtScaleの主な役割と特徴は以下の通りです。

1. データは保存先に留まる(No Data Movement)

AtScaleは、データを自身の環境にコピーしたり、保存したりしません。データは常に、顧客が利用している既存のデータウェアハウス(Snowflake、BigQuery、Redshiftなど)やデータレイク(S3、ADLSなど)に保存されたままです。

2. 「仮想OLAPキューブ」を構築

AtScaleは、保存されているデータの上に仮想的な分析層(セマンティックレイヤー、またはV-OLAPキューブ)を構築します。これにより、BIツール側からは、あたかも高速なOLAPキューブに直接接続しているかのように見えます。

3. クエリの翻訳・最適化

BIツールからの分析クエリ(MDXやSQL)を受け取り、それをデータソースが最も効率的に処理できる最適化されたSQLに変換し、データソースに送ります。この翻訳・最適化機能によって、大規模データに対する分析を高速化します。

💡 1. V-OLAPについて

仮想OLAP(Virtual OLAP: V-OLAP)は、同社のコア技術であり、データウェアハウスやデータレイク内の大規模データを、データを移動させたり、物理的なキューブを作成したりすることなく、高速に分析可能にするための仕組みです。

V-OLAPは、従来のOLAP(Online Analytical Processing)が抱えていた課題を解決し、セマンティックレイヤー(意味的レイヤー)を提供することで、企業のデータ活用を加速させます。


💡 1. V-OLAPの定義と役割

V-OLAPは、AtScaleが提供する仮想的なOLAPキューブ環境です。これは、物理的なデータのコピーや集計を事前に必要としません。

仮想セマンティックレイヤーとしての役割

V-OLAPの主な役割は、ビジネスロジックとメトリクス(指標)の定義を一元化する「セマンティックレイヤー」を提供することです。

  1. 接続: BIツール(Tableau、Power BI、Excelなど)から、あたかも高速なOLAPキューブに接続しているかのように見せかけます。
  2. 翻訳: 接続されたBIツールから送られてくるOLAPクエリ(MDX)やSQLを、データソース(Snowflake、BigQuery、データレイクなど)が理解できる最適化されたSQLクエリに瞬時に翻訳します。
  3. 高速化: 複雑なクエリや繰り返し実行されるクエリに対しては、自動的に集計結果をキャッシュ(Aggregation Storage)に保存し、レスポンス速度を劇的に向上させます。

📊 2. 従来の物理OLAPとの違い

V-OLAPの革新性は、従来の「物理OLAP」(ROLAP/MOLAP)との対比で明確になります。

項目V-OLAP (AtScale)従来の物理OLAP(ROLAP/MOLAP)
データ配置データソース内 (データレイクやデータウェアハウス内)OLAP専用のサーバーやデータベース内にコピー・集計される。
データの鮮度リアルタイムに近い(ソースデータが更新されればすぐに反映)キューブの再構築(バッチ処理)が必要なため、遅延が発生しやすい。
管理コスト低い(キューブ作成やETL/ELTプロセスが不要)高い(キューブの定義、構築、ETL処理のメンテナンスが必要)
技術仮想化、セマンティックレイヤー、クエリ最適化物理的な多次元配列(MOLAP)またはリレーショナルDBへの集約(ROLAP)

✅ 3. V-OLAPの主なメリット

V-OLAPは、大規模データ環境におけるデータ分析のボトルネックを解消します。

① データ移動の排除 (No Data Movement)

データを抽出・変換・ロード(ETL/ELT)してOLAP専用のストレージにコピーする必要がないため、データガバナンスが維持され、セキュリティリスクが低減します。データは最も安全な場所(データウェアハウスやデータレイク)に留まります。

② 指標の一貫性 (Consistency)

企業内のすべてのBIツール(Tableau、Power BI、Excelなど)が、AtScaleという単一のセマンティックレイヤーを介してデータにアクセスします。これにより、部門や利用ツールが異なっても、指標(例:売上、利益率)の定義がブレることを防ぎます。

③ 高速な分析パフォーマンス

V-OLAPは、データのサブセットを賢く事前に集計するスマートアグリゲーション(集計ストレージ)の技術を使用します。これにより、ユーザーはあたかも高速な物理キューブを操作しているかのように、テラバイト級、ペタバイト級のデータに対するクエリ結果を迅速に得ることができます。

V-OLAPは、データレイクやクラウドデータウェアハウスの能力を最大限に引き出し、ビジネスユーザーに柔軟で高速な分析環境を提供する、現代のデータアーキテクチャに不可欠なソリューションです。

💰 AtScale利用時の費用構造

費用の種類支払先概要
1. データプラットフォーム利用料Snowflake、Google Cloud (BigQuery)、AWS (Redshift) などデータの保存とクエリ実行(コンピュート)にかかる費用です。データ処理の基盤となるため、AtScaleの有無に関わらず発生します。
2. セマンティックレイヤー利用料AtScale社AtScaleのソフトウェア利用にかかるサブスクリプション料金です。指標定義の統一、クエリ最適化サービスへの対価です。
3. BIツール利用料Tableau、Power BI、Excel、Lookerなどユーザーがデータを見るためのフロントエンドツールのライセンス費用です。

💡 AtScaleの「追加コスト」を支払う理由

AtScaleの導入は追加コストとなりますが、企業がこのレイヤーに投資する主な理由は、コスト削減や生産性向上といった費用対効果にあります。

  • 指標の統一とガバナンス: 複数のBIツール(例:部門AはTableau、部門BはPower BI)を使っていても、AtScaleが単一の定義を保証するため、指標のブレによる誤った意思決定を防げます。
  • DWH利用料の最適化: AtScaleはクエリを最適化し、繰り返し実行されるクエリの集計結果をキャッシュ(保存)します。これにより、データウェアハウス側のコンピュート(処理)リソースの使用量を減らしDWHの利用コストを下げる効果があります。
  • ツール非依存性(アグノスティック): 特定のBIツールにロックインされることなく、組織内のすべての分析ツールと連携できる柔軟性を確保できます。

1. 「Business Glossary」による厳密なメタデータ管理

これは、データをビジネスユーザーにとって使いやすくするための中央辞書のようなものです。

専門用語意味なぜ必要か?
Business Glossaryビジネス用語集。KPI(重要業績評価指標)の正式名称、定義、計算ロジック、データソース、関連情報などを一元管理する機能。企業内で「売上」や「顧客」といった言葉の意味が部門やレポートによってバラバラになる(KPI乱立問題)のを防ぎ、全社的な一貫性を確保します。
論理名/定義データウェアハウス内の物理的なテーブル名やカラム名(例: fct_sls_v1_0.cst_id_02)ではなく、ユーザーが使うビジネス用語(例: 「顧客ID」、「純売上高」)をメジャーやディメンションに付与すること。ユーザーがデータ構造を知らなくても、「純売上高を地域別に見たい」**というビジネス用語で分析できるようになります。

2. LLM(AI-Link)への「コンテキスト辞書」としての活用

これが、R&Dの目的であるLLMによる開発・分析高速化において最も重要な点です。

専門用語意味なぜLLMに重要か?
LLM(AI-Link)のコンテキスト辞書AtScaleが管理する厳密なKPI定義(Business Glossary)を、LLM(ChatGPTやGeminiなど)が質問を解釈する際の背景情報として提供すること。LLMは賢いですが、「あなたの会社の純売上高の定義は何ですか?」という質問には答えられません。AtScaleが定義情報を提供することで、LLMは「純売上高 = (総売上 – 返品) ÷ 1.1」といった正確なビジネスロジックを把握し、それに基づいた正しいSQLを生成できます。
同義語問題の解決促進ユーザーが「売上」「収益」「Sales」など様々な言葉を使っても、LLMがコンテキストから**「これは純売上高という正式メジャーを参照している」**と推論し、正しいデータに導くこと。LLMの推論をセマンティックモデルで制御できるため、BIツール単体のNLQ機能よりも精度と信頼性が向上します。