update doc

david6666666 · david6666666 · commit d2adf20bad88 · 2025-12-18T19:23:28.000+08:00
Signed-off-by: David Chen &lt;530634352@qq.com&gt;
diff --git a/docs/user_guide/acceleration/cache_dit_acceleration.md b/docs/user_guide/acceleration/cache_dit_acceleration.md
@@ -50,6 +50,27 @@ omni = Omni(
 )
 ```
 
+## Online Serving (OpenAI-Compatible)
+
+Enable Cache-DiT for online serving by passing `--cache-backend cache_dit` when starting the server:
+
+```bash
+# Use Cache-DiT default (recommended) parameters
+vllm serve Qwen/Qwen-Image --omni --port 8091 --cache-backend cache_dit
+```
+
+To customize Cache-DiT settings for online serving, pass a JSON string via `--cache-config`:
+
+```bash
+vllm serve Qwen/Qwen-Image --omni --port 8091 \
+  --cache-backend cache_dit \
+  --cache-config '{"Fn_compute_blocks": 1, "Bn_compute_blocks": 0, "max_warmup_steps": 4, "residual_diff_threshold": 0.12}'
+```
+
+For complete, runnable scripts (including base64 image extraction), see:
+
+- `docs/user_guide/examples/online_serving/text_to_image.md`
+- `docs/user_guide/examples/online_serving/image_to_image.md`
 
 ## Acceleration Methods
 
diff --git a/docs/user_guide/acceleration/teacache.md b/docs/user_guide/acceleration/teacache.md
@@ -39,6 +39,21 @@ omni = Omni(
 )
 ```
 
+## Online Serving (OpenAI-Compatible)
+
+Enable TeaCache for online serving by passing `--cache-backend tea_cache` when starting the server:
+
+```bash
+vllm serve Qwen/Qwen-Image --omni --port 8091 \
+  --cache-backend tea_cache \
+  --cache-config '{"rel_l1_thresh": 0.2}'
+```
+
+For complete, runnable scripts (including base64 image extraction), see:
+
+- `docs/user_guide/examples/online_serving/text_to_image.md`
+- `docs/user_guide/examples/online_serving/image_to_image.md`
+
 ## Configuration Parameters
 
 ### `rel_l1_thresh` (float, default: `0.2`)
diff --git a/examples/online_serving/image_to_image/README.md b/examples/online_serving/image_to_image/README.md
@@ -1,4 +1,4 @@
-# Qwen-Image-Edit Online Serving
+# Image-To-Image
 
 This example demonstrates how to deploy Qwen-Image-Edit model for online image editing service using vLLM-Omni.
 
diff --git a/examples/online_serving/text_to_image/README.md b/examples/online_serving/text_to_image/README.md
@@ -1,4 +1,4 @@
-# Qwen-Image Online Serving
+# Text-To-Image
 
 This example demonstrates how to deploy Qwen-Image model for online image generation service using vLLM-Omni.
 

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-# Qwen-Image-Edit Online Serving`
	`1`	`+# Image-To-Image`
`2`	`2`
`3`	`3`	`This example demonstrates how to deploy Qwen-Image-Edit model for online image editing service using vLLM-Omni.`
`4`	`4`
Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-# Qwen-Image Online Serving`
	`1`	`+# Text-To-Image`
`2`	`2`
`3`	`3`	`This example demonstrates how to deploy Qwen-Image model for online image generation service using vLLM-Omni.`
`4`	`4`