Many Core 時代の tempdb のデータファイル数の考え方について at SE の雑記

SQL Server の tempdb のチューニングとして、次のような考え方があります。

tempdb のデータファイルを CPU の論理コア数に分割する
各データファイルのサイズ / 自動拡張サイズを均等にする
SQL Server 2014 以前のバージョンであれば、-T1117 / -T1118 を使用し、データファイルの同時拡張並びに単一エクステントを利用
tempdb はグローバルリソースとなるため高速なディスクに配置する

日本語の情報としては、DO’s&DONT’s #17: やっておいた方がいいこと – tempdb データファイル数を CPU 数に一致させるが有名ではないでしょうか。

昨今の CPU は 1 ソケットで、40 物理コア / HT 80 論理コアのモデルもあり、複数ソケットを使用すると 100 コアを超える環境も出てきます。

そのような Many Core 時代でも tempdb のデータファイルの分割は「論理 CPU コア数」で行うべきでしょうか？

本投稿では現在の tempdb のデータファイルの分割について触れたいと思います。

Contents

1 tempdb のデータファイルを分割する理由
2 SQL Server の進化による tempdb の同時実行性の向上
3 最新の tempdb のデータファイルの分割について
4 まとめ

tempdb のデータファイルを分割する理由

そもそもの話として、tempdb のデータファイルを分割する理由は何でしょうか？

「ラッチの競合を減少するため」という回答が多いと思いますが、どのようなラッチ競合を解消するかについては、ページ空き領域 (PFS) ページでのラッチの競合で解説が行われています。

データファイルにデータを書き込む際には、PFS (Page Free Space) という 8088 ページ毎に存在するページから、「どのページが開いているか」を確認する必要があります。

このようなデータベースを管理するページは「システムアロケーションページ」と呼ばれ、データベースにデータを書き込む際には、アクセスが集中する可能性があります。

tempdb のデータファイルを分割する理由は「システムアロケーションページの競合の緩和」を行うためです。

データファイルの分割は「CPU コア数に分割する」ことが目的ではなく、「システムアロケーションページの競合の緩和」が目的であるということを意識しておきます。

SQL Server の進化による tempdb の同時実行性の向上

SQL Server はバージョンの進化に合わせて、tempdb の効率化も行われています。

SQL Server 2016
- -T1117 / -T1118 がデフォルトの操作となり TF の設定が不要
  - SQL 2016 – It Just Runs Faster: -T1117 and -T1118 changes for TEMPDB and user databases
- インストール時に tempdb のデータファイルを自動的に構成
  - 8 または論理コア数の少ない値でデータファイルを自動的に構成
  - SQL 2016 – It Just Runs Faster: Automatic TEMPDB Configuration
SQL Server 2014 SP3 / 2016 SP1 CU9 , SP2 CU1 / 2017 CU7
- 同一データファイルで複数の PFS を使用することで、少量のデータファイルで PFS の競合を抑制
  - KB4099472-SQL Server 2014、2016、2017での PFS ページのラウンドロビンアルゴリズムの改善
  - 同一データファイル内の複数の PFS が使用できるようになるため、データファイルの拡張時には、新しい PFS も確保されるサイズが好ましく、SQL Server 2016 の tempdb の自動構成は 64 MB (1 回の拡張で新しい PFS も確保される) となっているのかと思います。
SQL Server 2019
- PFS の並行処理を共有ラッチで更新できるようにすることで同時実行性を向上
  - It Just Runs Faster: SQL Server 2019 TempDB Improvements
- メモリ最適化 tempdb メタデータによるラッチ競合の削減
  - メモリ最適化 tempdb メタデータ

SQL Server 2019 までは、PFS (Page Free Space) 関連のラッチの競合を減らすための様々なアプローチが行われています。

SQL Server 2022 では、SQL Server 2022: System Page Latch Concurrency Enhancements (Ep. 6) | Data Exposed で解説されているように、tempdb の競合の改善が行われており、GAM / SGAM の更新についても最適化が行われるようになるとアナウンスされています。

SQL Server のバージョンの進化によって、このような tempdb の同時実行性の向上が行われており、初期状態でもある程度、最適化が行われた状態で使用することができるようになっています。

まとめ

現在の SQL Server は、インストール時に複数のデータファイルで構成されるようになっており、最新の SQL Server では、1 ファイルでも tempdb の同時実行性はある程度確保できるようになっています。

tempdb のデータファイルは、「システムアロケーションページの競合の緩和」される範囲で実施し、不必要なファイルの分割は抑えることで最適なパフォーマンスを発揮することができるものとするのが、現在の tempdb のデータファイルの分割の基本方針となります。

「CPU コア数に分割する」は CPU のコア数が少なかった時代の考え方であり、Many Core の場合には、最初から CPU コア数にデータファイルを分割するのではなく、「競合の解消が確認できる範囲」でデータファイルを分割することで、最適なパフォーマンスを発揮するようにすることが重要ではないでしょうか。

なお、「Page Life Expectancy (PLE) が 300 秒以上となっていることが推奨」というのも、初期に提唱されていた時代のメモリサイズが現在と比較して小さかった時代のものであり、現在の推奨は「高い状態を維持しており、頻繁に低下しない」ことが推奨され、xxx 秒以上であるということは言われないようになっています。

「設定の目的を理解し、時代に沿った設定 / 状態を考える」ということは、常に意識しておきたいですね。

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

SE の雑記

Many Core 時代の tempdb のデータファイル数の考え方について

tempdb のデータファイルを分割する理由

SQL Server の進化による tempdb の同時実行性の向上

最新の tempdb のデータファイルの分割について

まとめ

Leave a Reply

検索

アーカイブ

最近の投稿

カテゴリー