SQL Server はクエリの実行時には 統計情報 を使用してクエリの実行プランを生成しています。
統計情報は、以下のような情報で構成されており統計情報の作成を行うテーブルのデータを参照して情報を作成する必要があります。
- ヒストグラム: 最大 200 の区間で構成されたデータの分布情報
- 密度ベクトル: データの重複状況 (どれだけユニークなデータが含まれているか)
統計情報を更新する際に実データに対しての検索が行われますがどのようにデータ取得が行われているかについてまとめておきたいと思います。