Skip to content

Commit 97f6647

Browse files
committed
feat: 新增新文章
1 parent b9dca34 commit 97f6647

File tree

9 files changed

+1693
-1
lines changed

9 files changed

+1693
-1
lines changed
Lines changed: 141 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,141 @@
1+
---
2+
layout: post
3+
title: "DevOps Taiwan Meetup #74 筆記 - Grafana AI 應用與多租戶 SaaS 架構導讀"
4+
tagline: "從 AI 查修到 SaaS 架構演進,週末充值信仰的 DevOps 筆記。"
5+
description: "紀錄 DevOps Taiwan Meetup #74 內容,包含《Grafana Zero to Hero》與《建構多租戶 SaaS 架構》兩本新書導讀,探討 Grafana 結合 Claude MCP 的查修應用,以及 SaaS 多租戶架構的四大難題與解決方案。"
6+
author: VagrantPi
7+
tags: DevOps Grafana SaaS Architecture Meetup EventNote AI
8+
imgurl-fb: /public/img/index/grafana.jpeg
9+
imgurl: /public/img/index/grafana.jpeg
10+
image: /public/img/index/grafana.jpeg
11+
imgalt: "DevOps Taiwan Meetup 筆記圖示"
12+
---
13+
14+
![eventbanner](/public/img/post/devops-taiwan/74/devops-meetup-74.jpg)
15+
16+
> event: https://devops.kktix.cc/events/meetup-73
17+
18+
19+
## 前言
20+
21+
這次 Meetup 為兩本書的導讀,所以很多都為點到為止
22+
23+
剛好之前有用顧 Grafana,而多租戶 SaaS 之前在小新創公司碰過,但整個系統框架還沒摸熟公司就倒了
24+
25+
所以此次題目都蠻感興趣的
26+
27+
---
28+
29+
## Grafana:建立系統全知視角的捷徑
30+
31+
![](/public/img/post/devops-taiwan/74/1.jpg)
32+
33+
> **Slide:** [Grafana:建立系統全知視角的捷徑](https://speakerdeck.com/blueswen/grafana-jian-li-xi-tong-quan-zhi-shi-jiao-de-jie-jing)
34+
35+
第一場是關於大家都熟到不能再熟的 Grafana。但這次講者帶來的內容不僅僅是拉拉 Dashboard,更多的是現代化監控以及 AI 賦能的應用。
36+
37+
### Drilldown App:免下語法直接抓 Bug
38+
39+
身為工程師,每次機器炸掉要查 Log / Metrics,或是要新增 Grafana 圖表時都要下各種 PromQL 或是 LogQL 語法。
40+
41+
Grafana 的 Drilldown App 解決了這個痛點,讓你可以**不需要下各種查詢語法**就能簡單地找到問題點。
42+
43+
> **注意:** 目前有限定支援的資料源,主要是 Grafana 自家的一條龍:Metrics (Prometheus) / Logs (Loki) / Traces (Tempo) / Profiles (Pyroscope)。
44+
45+
### 當 Grafana 遇上 Claude MCP
46+
47+
這大概是整場最讓我眼睛一亮的部分。透過 MCP (Model Context Protocol),讓 Claude 分析問題
48+
49+
![](https://github.com/blueswen/grafana-zero-to-hero/raw/main/use-case/grafana-llm/llm-demo-01.png)
50+
51+
52+
你可以直接在介面上問 AI:「為什麼這個服務會報警?」
53+
54+
![](https://github.com/blueswen/grafana-zero-to-hero/raw/main/use-case/grafana-llm/llm-demo-02.png)
55+
56+
最讓我 Shock 的是,串接 Github MCP 後,還可以**請 AI 直接分析問題點的程式碼在哪裡**,連 Code 都幫你找出來了
57+
58+
![](https://github.com/blueswen/grafana-zero-to-hero/raw/main/use-case/grafana-llm/llm-demo-03.png)
59+
60+
### 內部 Domain 知識怎麼辦?
61+
62+
如果公司有自己的 Domain 知識,原本想說是不是要自建 RAG (Retrieval-Augmented Generation),但講者提到自建 RAG 系統會太肥重。這邊推薦使用 [Claude Skills](https://www.claude.com/blog/skills),相對輕量很多。
63+
64+
### Q&A 精華
65+
66+
* **Q: Dashboard 太多了如何管理?**
67+
* **A:** 建議做一個 Over all 的 Dashboard,然後裡面用 Link 連出去,不要全部塞在同一個地方。
68+
69+
* **Q: Dashboard 偏視覺化,多人有權限修改時很容易壞掉,是否可以版控?**
70+
* **A:** 可以使用 Grafana Git Sync,或者等 IaC (如 Terraform provider for Grafana) 更加成熟後用語法來管理。
71+
72+
* **Q: 如何備份?**
73+
* **A:** 單一 Dashboard 備份 JSON 即可;整個 Grafana 資料庫預設是 SQLite,直接備份檔案就行。另外也有第三方 App 可以 Dump IaC 格式出來。
74+
75+
---
76+
77+
## 《建構多租戶 SaaS 架構》新書導讀:從混亂到秩序
78+
79+
![](/public/img/post/devops-taiwan/74/1.jpg)
80+
81+
第二場講的是 SaaS 架構。做產品跟做 SaaS 的思維完全不同,講者提到一個很棒的比喻:
82+
83+
如果只從「產品」角度思考,那是**平面**的:我們只想著「如何實現這個功能」。
84+
但 SaaS 是**第三維**的:當你的租戶量來到 1,000 個時,你要面對的是資料隔離、Log 爆炸、各國法規等立體的問題。
85+
86+
### SaaS 架構的四大難點
87+
88+
轉型 SaaS,一定會撞到這四道牆:
89+
90+
1. **安全 (Security)**
91+
* **痛點**:機敏資料隔離。如果只是在 Query 時加上 `WHERE tenant_id = xxx`,工程師手滑忘記加就會造成不同租戶資料互通,嚴重的話更會牽涉機敏資料外洩。
92+
* **Trade-Off**:Silo Model (獨佔資源) vs. Pool Model (共享資源) 各有優缺點。
93+
94+
2. **效能 (Performance)**
95+
* **痛點**:Noisy Neighbor(吵鬧的鄰居)。單一租戶高負載,把 CPU/DB/記憶體 吃光,導致其他正常租戶卡頓。
96+
* **Trade-Off**:預留資源 vs. 動態配置。
97+
98+
3. **擴展性 (Scale)**
99+
* **痛點**:為了配合不同客戶的客製化,程式碼出現各種 if-else 地獄。
100+
* **Trade-Off**:Static Config vs. Real-time Config。
101+
102+
4. **維運 (Operations)**
103+
* **痛點**:Unit Economics(單位經濟效益)失靈。很難算清楚每個租戶到底花了你多少雲端成本。
104+
* **Trade-Off**:Manual tagging vs Auto injection
105+
106+
### 解決方向與架構拆分
107+
108+
為了應對這些問題,架構上需要切成兩種不同層級:**Control Plane(控制層)****Application Plane(應用層)**
109+
110+
* **安全解法**:建立 Central Identity Service(中心化身分驗證)。
111+
* **效能解法**:利用 API Gateway 去切分不同的資源池。
112+
* **擴展解法**:善用 Feature Toggle(功能開關)。
113+
* **維運解法**:落實詳細的 Metric 收集。
114+
115+
> **"Architecture is the business model."** > 架構即商業模式。Control Plane 的存在是為了實現分層策略 (Tiering),系統應依照不同租戶的付費方案,配置不同的資源。
116+
117+
### 既有產品要轉換成 SaaS 的三步驟
118+
119+
如果你手上已經有現成的產品要上雲轉 SaaS,講者建議的順序是:
120+
121+
1. **身份認證 (Identity)**:先搞定租戶識別。
122+
2. **等級切分 (Tiering)**:定義不同價位的功能與資源。
123+
3. **自動化 (Automation)**:自動開通、自動擴縮容。
124+
125+
*補充:AI 帶來的新挑戰是,未來的 AI Agent 可以 access 到多底層的資料?這會是新的資安與架構考驗。*
126+
127+
### Q&A 精華
128+
129+
* **Q: 在 Share Pool 架構下,遇到惡意(或用量超大)的用戶佔用資源怎麼辦?**
130+
* **A:** 講者的實務案例:
131+
1. **個案處理**:有個客戶每個月底都會下載超大報表,這時就靠腳本自動幫他「特別開一台機器」,跑完就關掉,不影響其他用戶。
132+
2. **機制防禦**:API Gateway 的 Rate-limit 一定要設計好。
133+
134+
* **Q: SaaS 的計價問題怎麼算?**
135+
* **A:** 國外大廠很多都用「點數 (Credit)」制。好處是底層計算方式可以**比較黑箱**,廠商精算後再轉換成點數賣給客戶(這招真的很賊 XD)。
136+
137+
---
138+
139+
## 結語
140+
141+
每次參加 AI 有關的 Meetup 都會發現工具迭代速度之快,基本可以想像未來簡單重複性高又或是 RD 最懶得做的工作都會被 AI 給取代掉

_posts/2026-01-14-devops-taiwan-75-tdd-ama.md

Lines changed: 3 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -17,10 +17,12 @@ imgalt: "DevOps Taiwan Meetup #75 活動現場"
1717
1818
## 前言
1919

20-
好久沒參加實體的技術 Meetup 了!從 **TDD (Test-Driven Development)** 入門到放棄的我在之前公司導入時遇到蠻多問題的,這次活動很特別是 AMA (Ask Me Anything) 的形式,就來看看大家都遇到了些什麼問題,以及講師如何化解
20+
在之前的公司試著導入過,不過基本就是從 **TDD (Test-Driven Development)** 入門到放棄,導入時遇到蠻多問題的且面對極度彈性的需求變化上 TDD 我過往的場域中跑起來都沒有很順,這次活動很特別是 AMA (Ask Me Anything) 的形式,就來看看大家都遇到了些什麼問題,以及講師如何化解
2121

2222
TDD 這東西大家都聽過,但真的要在專案裡落地,通常都會遇到「老闆不給時間」、「同事不想寫」、「寫了測試反而更難改」等等的鬼故事。所以這篇筆記多為台下會眾提出問題,以及講師的回覆整理而成的。
2323

24+
另外提一點,因為是 AMA 因此後面基本都在實際問題與講師分享他的觀點為主,而不完完全全都在講 TDD
25+
2426
<br>
2527
<br>
2628

public/img/index/grafana.jpeg

3.8 KB
Loading
392 KB
Loading
259 KB
Loading
43.1 KB
Loading

0 commit comments

Comments
 (0)