2020 9月 at SE の雑記

Synapse の SQL Pool に関しては、Analytics Platform System (APS) という、以前は、Parallel Data Warehouse (PDW) と呼ばれていたシステムがベースになっており、基本的な考え方については、並列データウェアハウスコンポーネント-分析プラットフォームシステムの情報も参考になるケースがあります。

クエリの操作については、Analytics Platform System Appliance Update 5 Documentation and Client Tools からダウンロードできるドキュメントが今でも一番情報が記載されているのではないでしょうか。

このドキュメント内には、BroadcastMoveOperation と ShuffleMoveOperation についても記載されています。

BroadcastMoveOperation
- 分散データをレプリケートされたテーブルに移動する
- この操作は、ディストリビューションと互換性のない結合を実行しているときに使用される機会がある。
- この操作を実行するために、各ディストリビューションは、該当の行をすべてのComputeノードにブロードキャストする。
- その結果、各Computeノードは、自分の行に他のComputeノードから受け取ったすべての行を加えて、レプリケートされたテーブルを作成する。
ShuffleMoveOperation
- 分散されたテーブルを再配布する。
- 再配布されたテーブルは、元の分散テーブルとは異なる分散カラムを持ち、これは、互換性のない結合や互換性のない集約を実行している場合に使用されることがある。
- この操作を実行するために、DMSは、各行を分散先のテーブルの分布列に従って正しい計算ノードに移動する。
- 既に正しいComputeノードに格納されている行は、この操作中はコピーされない。

というような記載があります。

基本的には、ディストリビューションに格納されていないデータ間での結合や集計が発生した際に、他のディストリビューションのデータを再配布することで必要なデータをコピーする処理となるのですが、どのような動作が実行されているかについて、まとめたことがなかったので、この機会にまとめておこうかと思います。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 22nd, 2020 at 11:57 pm

Posted in Synapse Analytics

Tagged with Synapse Analytics

絵で見てわかる SQL Server の仕組みが発売されましたので一通り読んでみました

leave a comment

2020/9/14 に 11 年前に発売された平山さんの著書である絵で見てわかるSQL Serverの内部構造の改訂版となる絵で見てわかるSQL Serverの仕組みという SQL Server の書籍が発売されました。

Kindle 版の販売がまだ先だったので、紙の書籍を購入したものが今日届き、一通り目を通すことができましたので感想などを。

最新の SQL Server をターゲットとして、日本語で内部の動作に触れている書籍は、現時点ではこの書籍だけで、前作と同様に今回の改定版も良著ですので、「SQL Server を単純に操作するのではなく、内部動作を理解して製品を使用できるようになりたい」という思いがある方にとっては、最適な書籍ですので一度読まれてみてはいかがでしょうか。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 16th, 2020 at 11:51 pm

Posted in SQL Server

Tagged with SQL Server

Azure Data Factory の Private Link 対応が GA したので試してみる

leave a comment

Azure Data Factory での Azure Private Link のサポートの提供が開始されましたがアナウンスされていますが、Azure Data Factory (ADF) が Private Link をサポートしました。

詳細については、Azure Data Factory 用の Azure Private Link で公開されていますが、何ができるのかいまいちわかっていなかったので試してみました。

デフォルトの Azure 統合ランタイム (Azure IR) ではなく、Self-Hosted Integration Runtime (SHIR) を使用する場合に、通信を Private Endpoint 経由にするために使用するものなんでしょうかね。

データ周りを Private Link 経由にする方法もいろいろと調査しないと。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 16th, 2020 at 6:22 pm

Posted in Data Factory

Tagged with Data Factory

Azure Data Factory の Web Activity で REST API をコールする (MSI を使用しないケース)

leave a comment

Azure Data Factory の Web Activity を使用すると、パイプライン内で REST API をコールすることができます。

Azure のリソースにアクセスするのであれば、Data Factory の MSI を使用するアクティビティを作成すればよいのですが、MSI を使わない場合、どうやるのかを忘れて最初から調べなおすことがあるので、まとめておこうかと。

Azure Data Factory の MSI を使用するケースについては、次の情報を参照してください。

Data Factory のマネージド ID
マネージド ID (Web Activity で MSI を使用する)

今回は Data Factory の実行状況を確認するための REST API をコールしてみます。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 10th, 2020 at 8:37 pm

Posted in Azure Data Factory

Tagged with Azure Data Factory

検証目的で UPDATE STATISTICS で統計情報を手動で書き換える (update_stats_stream_option)

leave a comment

本投稿の内容を使用すると、クエリの実行プランに大きく影響を与えますので、検証目的でクエリの実行プランを変更する場合以外、本投稿の内容は使用しないでください。

ドキュメントにも「サポートされていない」ことが明記されており、本番環境で実行して、クエリの実行に大きく影響を与えても一切の責任は取りません。
クエリの実行に影響があると、本業務に影響を与える環境に対して実施する場合は自己責任で実施してください。

ということで、検証以外では、本投稿の内容は使用しないでください。
この投稿の内容は、クエリの実行プランが大きく変わり、性能にダイレクトに影響を与えます。

本来の目的はクローンデータベースを作成する際に、検証目的で統計情報の復元を行うためのものですので、統計情報の固定に使おうとすると、予期せぬ動作を引き起こす可能性が十分にあります。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 9th, 2020 at 9:06 pm

Posted in SQL Database,SQL Server

Tagged with SQL Database, SQL Server

非クラスター化インデックス作成時の処理状況 (進行状況) を確認する

leave a comment

以前書いた、SQL Server のクエリプロファイリングの活用の応用ではありますが、この方法は、非クラスター化インデックスを新規に作成するときにも活用することができます。

Enterprise Edition であれば、オンラインのインデックス操作でインデックスを作成することもできますが、データ量が大きい場合、実際のインデックス作成の状況がどこまで進んでいるのかを確認したいということはあると思います。(クエリの処理状況がわかると、メンテナンス作業を実行している最中の心理的安定性にもつながりますので)

クエリプロファイリングインフラストラクチャの機能を使用しており、SQL Server 2016 SP1 / Azure SQL Database であれば、オーバーヘッドを抑えて使用することができるかと。

Read the rest of this entry »

Written by Masayuki.Ozawa

9月 6th, 2020 at 10:23 pm

Posted in SQL Database,SQL Server

Tagged with SQL Database, SQL Server

SE の雑記

Archive for 9月, 2020

「新しい仮想クラスターで作成された」Azure SQL Managed Instance でグローバル VNET ピアリングがサポートされました

Ignite 2020 の SQL Server / SQL Database のセッション

Ignite 2020 で発表された SQL Server / SQL Database 関連の更新情報

Synapse の BroadcastMove / ShuffleMove の動作について

絵で見てわかる SQL Server の仕組みが発売されましたので一通り読んでみました

Azure Data Factory の Private Link 対応が GA したので試してみる

Azure Data Factory の Web Activity で REST API をコールする (MSI を使用しないケース)

検証目的で UPDATE STATISTICS で統計情報を手動で書き換える (update_stats_stream_option)

非クラスター化インデックス作成時の処理状況 (進行状況) を確認する

検索

アーカイブ

最近の投稿

カテゴリー

2020年9月
月	火	水	木	金	土	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30