プルーニングが使えない理由

クエリ1：プルーニングが「使える」理由

WHERE C_CUSTOMER_SK between 100000 and 600000
AND C_LAST_NAME LIKE 'Johnson'

ID（SK）の連続性: C_CUSTOMER_SK（サロゲートキー）のような連番のIDは、通常、データがロードされた順序と一致します。Snowflakeはデータをロード順にマイクロパーティションに分割するため、各パーティションの C_CUSTOMER_SK の「最小値〜最大値」の範囲が非常に狭く、重複しにくくなります。
劇的な絞り込み: 「10万から60万の間」という条件があれば、Snowflakeのメタデータを見るだけで、「このファイルは1〜5万だから無視」「このファイルは10〜15万だから読む」と、読むべきファイルを物理的に切り捨て（プルーニング）できます。

WHERE C_LAST_NAME = 'Johnson'

名前のランダム性: データのロード順が「名前順」になっていない限り、C_LAST_NAME（姓）はあらゆるマイクロパーティションに分散して保存されます。
メタデータの限界: 全てのパーティションのメタデータ（最小値〜最大値）が「Aさん〜Zさん」という広い範囲をカバーしてしまっている場合、Snowflakeは「’Johnson’ さんがどのファイルにいるか分からない（＝全ファイルにいる可能性がある）」と判断します。
結果: 結局、ほぼ全てのパーティションをスキャンしなければならなくなり、パフォーマンスが低下します。

ここで重要なのは、演算子が LIKE か = かではなく、「フィルタリングするカラムが、データの物理的な並び順（クラスタリング）を反映しているか」です。