AtScale｜Agile育成ブログ

データとBIツール（Tableau、Excelなど）の間に位置する「仮想セマンティックレイヤー」を提供するSaaS

💡 AtScaleの役割：データ保存ではなく「データの橋渡し」

AtScaleの主な役割と特徴は以下の通りです。

1. データは保存先に留まる（No Data Movement）

AtScaleは、データを自身の環境にコピーしたり、保存したりしません。データは常に、顧客が利用している既存のデータウェアハウス（Snowflake、BigQuery、Redshiftなど）やデータレイク（S3、ADLSなど）に保存されたままです。

2. 「仮想OLAPキューブ」を構築

AtScaleは、保存されているデータの上に仮想的な分析層（セマンティックレイヤー、またはV-OLAPキューブ）を構築します。これにより、BIツール側からは、あたかも高速なOLAPキューブに直接接続しているかのように見えます。

3. クエリの翻訳・最適化

BIツールからの分析クエリ（MDXやSQL）を受け取り、それをデータソースが最も効率的に処理できる最適化されたSQLに変換し、データソースに送ります。この翻訳・最適化機能によって、大規模データに対する分析を高速化します。

💡 1. V-OLAPについて

仮想OLAP（Virtual OLAP: V-OLAP）は、同社のコア技術であり、データウェアハウスやデータレイク内の大規模データを、データを移動させたり、物理的なキューブを作成したりすることなく、高速に分析可能にするための仕組みです。

V-OLAPは、従来のOLAP（Online Analytical Processing）が抱えていた課題を解決し、セマンティックレイヤー（意味的レイヤー）を提供することで、企業のデータ活用を加速させます。

💡 1. V-OLAPの定義と役割

V-OLAPは、AtScaleが提供する仮想的なOLAPキューブ環境です。これは、物理的なデータのコピーや集計を事前に必要としません。

仮想セマンティックレイヤーとしての役割

V-OLAPの主な役割は、ビジネスロジックとメトリクス（指標）の定義を一元化する「セマンティックレイヤー」を提供することです。

接続: BIツール（Tableau、Power BI、Excelなど）から、あたかも高速なOLAPキューブに接続しているかのように見せかけます。
翻訳: 接続されたBIツールから送られてくるOLAPクエリ（MDX）やSQLを、データソース（Snowflake、BigQuery、データレイクなど）が理解できる最適化されたSQLクエリに瞬時に翻訳します。
高速化: 複雑なクエリや繰り返し実行されるクエリに対しては、自動的に集計結果をキャッシュ（Aggregation Storage）に保存し、レスポンス速度を劇的に向上させます。

📊 2. 従来の物理OLAPとの違い

V-OLAPの革新性は、従来の「物理OLAP」（ROLAP/MOLAP）との対比で明確になります。

項目	V-OLAP (AtScale)	従来の物理OLAP（ROLAP/MOLAP）
データ配置	データソース内 (データレイクやデータウェアハウス内)	OLAP専用のサーバーやデータベース内にコピー・集計される。
データの鮮度	リアルタイムに近い（ソースデータが更新されればすぐに反映）	キューブの再構築（バッチ処理）が必要なため、遅延が発生しやすい。
管理コスト	低い（キューブ作成やETL/ELTプロセスが不要）	高い（キューブの定義、構築、ETL処理のメンテナンスが必要）
技術	仮想化、セマンティックレイヤー、クエリ最適化	物理的な多次元配列（MOLAP）またはリレーショナルDBへの集約（ROLAP）

✅ 3. V-OLAPの主なメリット

V-OLAPは、大規模データ環境におけるデータ分析のボトルネックを解消します。

① データ移動の排除 (No Data Movement)

データを抽出・変換・ロード（ETL/ELT）してOLAP専用のストレージにコピーする必要がないため、データガバナンスが維持され、セキュリティリスクが低減します。データは最も安全な場所（データウェアハウスやデータレイク）に留まります。

② 指標の一貫性 (Consistency)

企業内のすべてのBIツール（Tableau、Power BI、Excelなど）が、AtScaleという単一のセマンティックレイヤーを介してデータにアクセスします。これにより、部門や利用ツールが異なっても、指標（例：売上、利益率）の定義がブレることを防ぎます。

③ 高速な分析パフォーマンス

V-OLAPは、データのサブセットを賢く事前に集計するスマートアグリゲーション（集計ストレージ）の技術を使用します。これにより、ユーザーはあたかも高速な物理キューブを操作しているかのように、テラバイト級、ペタバイト級のデータに対するクエリ結果を迅速に得ることができます。

V-OLAPは、データレイクやクラウドデータウェアハウスの能力を最大限に引き出し、ビジネスユーザーに柔軟で高速な分析環境を提供する、現代のデータアーキテクチャに不可欠なソリューションです。

💰 AtScale利用時の費用構造

費用の種類	支払先	概要
1. データプラットフォーム利用料	Snowflake、Google Cloud (BigQuery)、AWS (Redshift) など	データの保存とクエリ実行（コンピュート）にかかる費用です。データ処理の基盤となるため、AtScaleの有無に関わらず発生します。
2. セマンティックレイヤー利用料	AtScale社	AtScaleのソフトウェア利用にかかるサブスクリプション料金です。指標定義の統一、クエリ最適化サービスへの対価です。
3. BIツール利用料	Tableau、Power BI、Excel、Lookerなど	ユーザーがデータを見るためのフロントエンドツールのライセンス費用です。

💡 AtScaleの「追加コスト」を支払う理由

AtScaleの導入は追加コストとなりますが、企業がこのレイヤーに投資する主な理由は、コスト削減や生産性向上といった費用対効果にあります。

指標の統一とガバナンス: 複数のBIツール（例：部門AはTableau、部門BはPower BI）を使っていても、AtScaleが単一の定義を保証するため、指標のブレによる誤った意思決定を防げます。
DWH利用料の最適化: AtScaleはクエリを最適化し、繰り返し実行されるクエリの集計結果をキャッシュ（保存）します。これにより、データウェアハウス側のコンピュート（処理）リソースの使用量を減らし、DWHの利用コストを下げる効果があります。
ツール非依存性（アグノスティック）: 特定のBIツールにロックインされることなく、組織内のすべての分析ツールと連携できる柔軟性を確保できます。

1. 「Business Glossary」による厳密なメタデータ管理

これは、データをビジネスユーザーにとって使いやすくするための中央辞書のようなものです。

専門用語	意味	なぜ必要か？
Business Glossary	ビジネス用語集。KPI（重要業績評価指標）の正式名称、定義、計算ロジック、データソース、関連情報などを一元管理する機能。	企業内で「売上」や「顧客」といった言葉の意味が部門やレポートによってバラバラになる（KPI乱立問題）のを防ぎ、全社的な一貫性を確保します。
論理名/定義	データウェアハウス内の物理的なテーブル名やカラム名（例: `fct_sls_v1_0.cst_id_02`）ではなく、ユーザーが使うビジネス用語（例: 「顧客ID」、「純売上高」）をメジャーやディメンションに付与すること。	ユーザーがデータ構造を知らなくても、「純売上高を地域別に見たい」**というビジネス用語で分析できるようになります。

2. LLM（AI-Link）への「コンテキスト辞書」としての活用

これが、R&Dの目的であるLLMによる開発・分析高速化において最も重要な点です。

専門用語	意味	なぜLLMに重要か？
LLM（AI-Link）のコンテキスト辞書	AtScaleが管理する厳密なKPI定義（Business Glossary）を、LLM（ChatGPTやGeminiなど）が質問を解釈する際の背景情報として提供すること。	LLMは賢いですが、「あなたの会社の純売上高の定義は何ですか？」という質問には答えられません。AtScaleが定義情報を提供することで、LLMは「純売上高 = (総売上 – 返品) ÷ 1.1」といった正確なビジネスロジックを把握し、それに基づいた正しいSQLを生成できます。
同義語問題の解決促進	ユーザーが「売上」「収益」「Sales」など様々な言葉を使っても、LLMがコンテキストから「これは純売上高という正式メジャーを参照している」と推論し、正しいデータに導くこと。	LLMの推論をセマンティックモデルで制御できるため、BIツール単体のNLQ機能よりも精度と信頼性が向上します。