Build 2020 の SQL Server 関連セッションのリンクをまとめてみました。
Build Live と Community セッションはまだ見れていません…。
オンラインの特性でしょうか、QA の時間が活発で英語力のなさを痛感しましたとさ…。
(毎回、イベントのたびに痛感するんですが)
今回の Build 2020 は完全にオンラインで、同一のセッションを時間を変えて 3 回実施するというような形式でしたので、同名のセッションが複数公開されています。
Azure 上で動作する SQL ファミリーの最新情報に関して。
Azure では様々な方法で SQL Server または、SQL Server をベースとしたデータベースエンジンを使用することができますが、機能の互換性により、どの利用形態を検討すればよいかについての考え方について提示が行われていました。
SQL Server の機能はバージョンとともに進化しており、最新バージョンでは開発 / 可用性 / 暗号化で様々な機能を使用することができ、アプリケーションを最新の機能を活用しながらモダナイゼーションすることができます。
Azure IoT 参照アーキテクチャ として、ウォームパス (スピードレイヤー) に SQL Database を使用したリファレンスアーキテクチャについて紹介も行われていました。
Cosmos DB を使用した、ラムダアーキテクチャの資料を見る機会は多いのですが、SQL Database を使用したものは見る機会が少ない気がします。
セッションでは、デモが実施されていましたが、Streaming at Scale with Azure Event Hubs, Stream Analytics and Azure SQL で環境構築用の ARM テンプレートが提供されていますので、時間があるときに自分でも触ってみたいですね。
アップデートについても触れられていました。
Build 2020 では、SQL Server の新しい製品が出たというわけではありませんので、この辺は既存の情報がほとんどかもしれませんね。
-
INT122A : Optimize price-performance using Azure SQL Database serverless
-
INT122B : Optimize price-performance using Azure SQL Database serverless
-
INT122C : Optimize price-performance using Azure SQL Database serverless
SQL Database Serverless に関してのセッション。
サーバーレスと通常の vCore モデルのスケーリングの見せ方は分かりやすいですね。
アーキテクチャについても触れられていました。
基本的な構成は、vCore モデルと同等ですが、サーバーレス用のメモリ管理が新たに導入されている感じでしょうか。
今後のロードマップについても紹介されています。
開発者の負担の軽減のために、リトライロジック周りの改善を検討されているとのことでした。
-
INT123A : Using Azure SQL Edge to build smarter renewable energy solutions
-
INT123B : Using Azure SQL Edge to build smarter renewable energy solutions
-
INT123C : Using Azure SQL Edge to build smarter renewable energy solutions
Build 2020 でパブリックプレビューとなった SQL Edge (以前は SQL Database Edge と呼ばれていた) のセッションです。
SQL Edge を使用した機械学習とリアルタイム分析の構成を例としてのセッションとなっていました。
SQL Edge に取得されているセンサーデータを pyodbc で接続しながら分析を行うコードが。
一回写経して Python を使用したデータ操作を覚えたいものですな。
Azure ML で ONNX のモデルを作成して、
そのモデルをモジュールにデプロイして機械学習で予測を行ったりと。
現時点ではデモは Github 等で公開は行われていないようなのですが、今後、数週間で公開の予定はあるようです。
モデルの差し替えを IoT Hub から実施できるので、IoT Hub 上で一元管理されている基盤としての取り扱いやすさはありそうですね。
QA の中で Announcing the new machine learning extension の発表内容についても紹介がありましたので、Azure ML 関連の情報もキャッチアップが必要ですね。
新しいクエリの構文として時系列処理を行うためのクエリの存在についても触れられており、時系列データの取り扱いの容易性についてもポイントとなるようです。
-
INT124A : Building real-time HTAP analytics solutions with Azure Cosmos DB & Azure Synapse Analytics
-
INT124B : Building real-time HTAP analytics solutions with Azure Cosmos DB & Azure Synapse Analytics
-
INT124C : Building real-time HTAP analytics solutions with Azure Cosmos DB & Azure Synapse Analytics
Synapse Link を使用した HTAP 構成について。
Cosmos を最小のデータソースとして使用した、ラムダアーキテクチャを組むのにとても便利ですね。
SQL Database が持っている PREDICT 関数を使用した機械学習をも Synapse では有効に活用できますので、機械学習による新しいデータの洞察を得ることもできます。
Synapse の Spark で AutoML を使用した分析も活用できるので、様々なデータ分析方法を利用できますね。
SQL Server 2019 の Linux コンテナーを使用した開発シナリオについて。
PolyBase / 機械学習 / DevOps パイプラインを SQL Server と組み合わせてどのような開発ができるのか。
でもコンテンツは // Build 2020 Demos for SQL Server on Linux and Containers で公開されていますので、パイプラインを用いたコンテナーのシナリオは一度自分でも実施してみたいですね。
-
INT129A : Developing end-to-end analytics solutions with the latest Azure Synapse features
-
INT129B : Developing end-to-end analytics solutions with the latest Azure Synapse features
-
INT129C : Developing end-to-end analytics solutions with the latest Azure Synapse features
Synapse についてのセッション。
Synapse の全体像を示す、このスライドがとても分かりやすかったです。
4 つのデモが紹介されており、CDM からのデータ取り込みになども行われています。
Synapse を使用してどのようにデータを取り扱うことができるかが実際の動作として確認を行うことができます。
-
INT130A : Running cost effective big data workloads with Azure Synapse and Azure Data Lake Storage
-
INT130B : Running cost effective big data workloads with Azure Synapse and Azure Data Lake Storage
-
INT130C : Running cost effective big data workloads with Azure Synapse and Azure Data Lake Storage
Synapse の Data Lake と Spark の活用。
Spark については、.NET の Notebook (.NET Spark) を使用したデモが行われています。
Datalake に格納された Tweet の CSV を使用して、.NET のコードベースで分析を行ったり、Spark SQL を使用して分析を行ったりと、Synapse の Spark の部分を使用した分析手法が紹介されています。