データとBIツール(Tableau、Excelなど)の間に位置する「仮想セマンティックレイヤー」を提供するSaaS
💡 AtScaleの役割:データ保存ではなく「データの橋渡し」
AtScaleの主な役割と特徴は以下の通りです。
1. データは保存先に留まる(No Data Movement)
AtScaleは、データを自身の環境にコピーしたり、保存したりしません。データは常に、顧客が利用している既存のデータウェアハウス(Snowflake、BigQuery、Redshiftなど)やデータレイク(S3、ADLSなど)に保存されたままです。
2. 「仮想OLAPキューブ」を構築
AtScaleは、保存されているデータの上に仮想的な分析層(セマンティックレイヤー、またはV-OLAPキューブ)を構築します。これにより、BIツール側からは、あたかも高速なOLAPキューブに直接接続しているかのように見えます。
3. クエリの翻訳・最適化
BIツールからの分析クエリ(MDXやSQL)を受け取り、それをデータソースが最も効率的に処理できる最適化されたSQLに変換し、データソースに送ります。この翻訳・最適化機能によって、大規模データに対する分析を高速化します。
💡 1. V-OLAPについて
仮想OLAP(Virtual OLAP: V-OLAP)は、同社のコア技術であり、データウェアハウスやデータレイク内の大規模データを、データを移動させたり、物理的なキューブを作成したりすることなく、高速に分析可能にするための仕組みです。
V-OLAPは、従来のOLAP(Online Analytical Processing)が抱えていた課題を解決し、セマンティックレイヤー(意味的レイヤー)を提供することで、企業のデータ活用を加速させます。
💡 1. V-OLAPの定義と役割
V-OLAPは、AtScaleが提供する仮想的なOLAPキューブ環境です。これは、物理的なデータのコピーや集計を事前に必要としません。
仮想セマンティックレイヤーとしての役割
V-OLAPの主な役割は、ビジネスロジックとメトリクス(指標)の定義を一元化する「セマンティックレイヤー」を提供することです。
- 接続: BIツール(Tableau、Power BI、Excelなど)から、あたかも高速なOLAPキューブに接続しているかのように見せかけます。
- 翻訳: 接続されたBIツールから送られてくるOLAPクエリ(MDX)やSQLを、データソース(Snowflake、BigQuery、データレイクなど)が理解できる最適化されたSQLクエリに瞬時に翻訳します。
- 高速化: 複雑なクエリや繰り返し実行されるクエリに対しては、自動的に集計結果をキャッシュ(Aggregation Storage)に保存し、レスポンス速度を劇的に向上させます。
📊 2. 従来の物理OLAPとの違い
V-OLAPの革新性は、従来の「物理OLAP」(ROLAP/MOLAP)との対比で明確になります。
| 項目 | V-OLAP (AtScale) | 従来の物理OLAP(ROLAP/MOLAP) |
| データ配置 | データソース内 (データレイクやデータウェアハウス内) | OLAP専用のサーバーやデータベース内にコピー・集計される。 |
| データの鮮度 | リアルタイムに近い(ソースデータが更新されればすぐに反映) | キューブの再構築(バッチ処理)が必要なため、遅延が発生しやすい。 |
| 管理コスト | 低い(キューブ作成やETL/ELTプロセスが不要) | 高い(キューブの定義、構築、ETL処理のメンテナンスが必要) |
| 技術 | 仮想化、セマンティックレイヤー、クエリ最適化 | 物理的な多次元配列(MOLAP)またはリレーショナルDBへの集約(ROLAP) |
✅ 3. V-OLAPの主なメリット
V-OLAPは、大規模データ環境におけるデータ分析のボトルネックを解消します。
① データ移動の排除 (No Data Movement)
データを抽出・変換・ロード(ETL/ELT)してOLAP専用のストレージにコピーする必要がないため、データガバナンスが維持され、セキュリティリスクが低減します。データは最も安全な場所(データウェアハウスやデータレイク)に留まります。
② 指標の一貫性 (Consistency)
企業内のすべてのBIツール(Tableau、Power BI、Excelなど)が、AtScaleという単一のセマンティックレイヤーを介してデータにアクセスします。これにより、部門や利用ツールが異なっても、指標(例:売上、利益率)の定義がブレることを防ぎます。
③ 高速な分析パフォーマンス
V-OLAPは、データのサブセットを賢く事前に集計するスマートアグリゲーション(集計ストレージ)の技術を使用します。これにより、ユーザーはあたかも高速な物理キューブを操作しているかのように、テラバイト級、ペタバイト級のデータに対するクエリ結果を迅速に得ることができます。
V-OLAPは、データレイクやクラウドデータウェアハウスの能力を最大限に引き出し、ビジネスユーザーに柔軟で高速な分析環境を提供する、現代のデータアーキテクチャに不可欠なソリューションです。
💰 AtScale利用時の費用構造
| 費用の種類 | 支払先 | 概要 |
| 1. データプラットフォーム利用料 | Snowflake、Google Cloud (BigQuery)、AWS (Redshift) など | データの保存とクエリ実行(コンピュート)にかかる費用です。データ処理の基盤となるため、AtScaleの有無に関わらず発生します。 |
| 2. セマンティックレイヤー利用料 | AtScale社 | AtScaleのソフトウェア利用にかかるサブスクリプション料金です。指標定義の統一、クエリ最適化サービスへの対価です。 |
| 3. BIツール利用料 | Tableau、Power BI、Excel、Lookerなど | ユーザーがデータを見るためのフロントエンドツールのライセンス費用です。 |
💡 AtScaleの「追加コスト」を支払う理由
AtScaleの導入は追加コストとなりますが、企業がこのレイヤーに投資する主な理由は、コスト削減や生産性向上といった費用対効果にあります。
- 指標の統一とガバナンス: 複数のBIツール(例:部門AはTableau、部門BはPower BI)を使っていても、AtScaleが単一の定義を保証するため、指標のブレによる誤った意思決定を防げます。
- DWH利用料の最適化: AtScaleはクエリを最適化し、繰り返し実行されるクエリの集計結果をキャッシュ(保存)します。これにより、データウェアハウス側のコンピュート(処理)リソースの使用量を減らし、DWHの利用コストを下げる効果があります。
- ツール非依存性(アグノスティック): 特定のBIツールにロックインされることなく、組織内のすべての分析ツールと連携できる柔軟性を確保できます。
1. 「Business Glossary」による厳密なメタデータ管理
これは、データをビジネスユーザーにとって使いやすくするための中央辞書のようなものです。
| 専門用語 | 意味 | なぜ必要か? |
| Business Glossary | ビジネス用語集。KPI(重要業績評価指標)の正式名称、定義、計算ロジック、データソース、関連情報などを一元管理する機能。 | 企業内で「売上」や「顧客」といった言葉の意味が部門やレポートによってバラバラになる(KPI乱立問題)のを防ぎ、全社的な一貫性を確保します。 |
| 論理名/定義 | データウェアハウス内の物理的なテーブル名やカラム名(例: fct_sls_v1_0.cst_id_02)ではなく、ユーザーが使うビジネス用語(例: 「顧客ID」、「純売上高」)をメジャーやディメンションに付与すること。 | ユーザーがデータ構造を知らなくても、「純売上高を地域別に見たい」**というビジネス用語で分析できるようになります。 |
2. LLM(AI-Link)への「コンテキスト辞書」としての活用
これが、R&Dの目的であるLLMによる開発・分析高速化において最も重要な点です。
| 専門用語 | 意味 | なぜLLMに重要か? |
| LLM(AI-Link)のコンテキスト辞書 | AtScaleが管理する厳密なKPI定義(Business Glossary)を、LLM(ChatGPTやGeminiなど)が質問を解釈する際の背景情報として提供すること。 | LLMは賢いですが、「あなたの会社の純売上高の定義は何ですか?」という質問には答えられません。AtScaleが定義情報を提供することで、LLMは「純売上高 = (総売上 – 返品) ÷ 1.1」といった正確なビジネスロジックを把握し、それに基づいた正しいSQLを生成できます。 |
| 同義語問題の解決促進 | ユーザーが「売上」「収益」「Sales」など様々な言葉を使っても、LLMがコンテキストから**「これは純売上高という正式メジャーを参照している」**と推論し、正しいデータに導くこと。 | LLMの推論をセマンティックモデルで制御できるため、BIツール単体のNLQ機能よりも精度と信頼性が向上します。 |



