ROMANCE DAWN for the new world

Microsoft Azure を中心とした技術情報を書いています。

Japan Azure User Group 14周年イベントで Azure App Service の Sidecar の話をしてきました

Japan Azure User Group 14周年イベントに参加して、Azure App Service on Linux の Sidecar に Phi-3 を配置するアーキテクチャの話をしてきました。

jazug.connpass.com

App Service の Sidecar に SLM をセルフホストするアーキテクチャを中心に、Sidecar の使いどころの考察も含めて話しました。
www.youtube.com
speakerdeck.com

まだ Preview なので、実運用には足りない機能や制約もありますが、これからのインテリジェントアプリケーション開発において注目したいアーキテクチャです。

X(Twitter)での反応は比較的好評で楽しんでいただけたようですし、数名の方から直接フィードバックをいただくこともできたので、話して良かったなと思いました。
フィードバックをいただいた内容のうち、2点ほど補足しておきます。

どのくらいの App Service Plan が必要になるのか?

Sidecar で SLM を動かすためには、相応の SKU の App Service Plan が必要です。デモしたアプリは Premium v3 P3V3(CPU 8、Memory 32GB)を選択していました。
とくに初回起動時は、Phi-3 イメージのプルと展開で負荷がかかるので、デフォルトの SKU の Premium v3 P0V3(CPU 1、Memory 4GB)ではアプリを起動できませんでした。
セッションでは AOAI と比較したコスト削減のメリットを挙げていましたが、App Service Plan にそれなりのコストがかかることは知っておいてください。

Sidecar がリソースを消費しすぎてメインアプリに影響を与えそう

Sidecar の SLM が多くのリソース(CPU と Memory)を消費してしまうことで、メインのアプリケーションに影響を与えてしまうリスクがあります。
Kubernetes には Pod 内のコンテナーに対して Resource limits を設定できるので、このような機能が App Service の Sidecar にも必要だと思います。
kubernetes.io

公式フォーラムにフィードバックしておきました。
https://feedback.azure.com/d365community/idea/83acbe10-6584-ef11-9442-6045bd8115dc

今回のイベントでは、JAZUG に初参加の方が多くいました。お仕事でも趣味でも Azure が好きな人たちが集まって楽しめるコミュニティになるように、15周年に向けて盛り上げていきたいです。