Day 2 のキーノートです。
Day 2 は新機能等ではなく、アーキテクチャ等のお話が多いかと思いますが、今回はクラウド時代の DWH のアーキテクチャについてで、かなり興味深かったです。
![]()
Virtual Chapter Member に日本含まれているんですね。
![]()
来年になると PASS BA Day があるそうです。
![]()
続いて、Denise Mclnerney さん。
![]()
PASS の Web サイトのデザインが変わるそうです。レスポンシブデザインになるみたいですね。
![]()
来年も似た時期にあるようです。
![]()
スピーカーは変わって David DeWitt さんに。
去年でラストかと思ったら今年も登壇!!
![]()
お題は Data Warehousing in the Cloud
![]()
![]()
MS ではなく、MIT に移られているので、SQL Server 製品以外も紹介されますねw
![]()
![]()
この辺はお高いやつ
![]()
この辺はミドルレンジの製品ですね。
![]()
クラウドはこの辺に
![]()
複数の軸での比較
突然のめんたろ社長!!
![]()
![]()
![]()
クラウド DW をなぜ使うか。
![]()
スケーラブルな DW の基本について。
![]()
二つのスケーラブル DW のデザイン
SQL Server 以外触っていないので知らない製品がちょいちょい。
![]()
シェアードナッシング型。
![]()
こちらは共有ストレージ型。
![]()
パーティショニングされたテーブル
この辺は SQLDW のテーブル構造を思い出す感じですね。
![]()
![]()
ラウンドロビンによるパーティショニング
![]()
![]()
ハッシュによるパーティショニング
![]()
最後はテーブルのレプリケーション
APS には実装されているのですが、SQLDWH にはいつ来るのでしょうかね。
![]()
こちらは操作における並列化ですかね。
![]()
SQLDWH や Polybase はこの構成ですね。
![]()
![]()
共有ストレージ側の場合。
![]()
先ほどは集計でしたが今度は結合
![]()
結合するテーブルによる操作の違い
この辺は SQLDWH の DMS の操作ですね。
![]()
![]()
![]()
![]()
ローカル JOIN やシャッフルの操作についての解説が。
ローカルにデータがない場合はシャッフル操作で一時的なデータの移動が発生します。
![]()
![]()
![]()
ノードの障害について。
シェアードナッシング型の場合は、他のノードのデータのコピーを持つことで、ノードの障害に備える形に。
![]()
![]()
![]()
![]()
ベターな分割としては、完全なコピーを単一のノードで持つのではなく、コピーは分散させることで、障害発生時の性能劣化を抑えることができると。ノード数が多ければ、障害発生時の性能劣化の影響がさらに低く。![]()
続いては共有ストレージタイプの場合。
ノードとデータは独立していますので、ノード障害が発生してもデータにはアクセスできる状況に
ストレージ障害に備えるためにはデータコピーを持つのは変わらないですね。
![]()
![]()
![]()
続いては競合比較。
最初は Redshift の構成について。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
次は Snowflake。
こちらは行ベースなのですね。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
最後は SQLDWH
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
各社比較に。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
黙々と資料見てしまいましたが、SQL DWH 以外の DWH は初見に近いのでかなり面白かったです!!
![]()
[…] PASS Summit 2016 Day 2 のキーノート […]
Azure Update (2016.10.31) | ブチザッキ
31 10月 16 at 06:21