modelscope · xwy-bit · Dec 12, 2025 · gemini-code-assist · Dec 12, 2025
diff --git a/swift/llm/model/model/internlm.py b/swift/llm/model/model/internlm.py
@@ -5,7 +5,7 @@
 
 import torch
 from transformers.dynamic_module_utils import get_class_from_dynamic_module
-
+from transformers import GenerationMixin
 from swift.llm import TemplateType
 from ..constant import LLMModelType, MLLMModelType, RMModelType
 from ..model_arch import ModelArch
@@ -139,6 +139,16 @@ def get_model_tokenizer_internvl(model_dir: str,
         use_submodel_func(model, 'language_model')
         patch_output_clone(model.language_model.get_input_embeddings())
 
+    if model is not None:
+            # fix missing generate method for InternVL-2.5 models when using transformers >= 4.50
+            llm_part = getattr(model, 'language_model', model)  
+            if not hasattr(llm_part, 'generate'): 
+                print("Detected missing 'generate' method (transformers >= 4.50). Injecting GenerationMixin...")
+
+                cls = llm_part.__class__
+                if GenerationMixin not in cls.__bases__:
+                    cls.__bases__ = cls.__bases__ + (GenerationMixin,)
+
-    if model is not None:
-            # fix missing generate method for InternVL-2.5 models when using transformers >= 4.50
-            llm_part = getattr(model, 'language_model', model)  
-            if not hasattr(llm_part, 'generate'): 
-                print("Detected missing 'generate' method (transformers >= 4.50). Injecting GenerationMixin...")
-                
-                cls = llm_part.__class__
-                if GenerationMixin not in cls.__bases__:
-                    cls.__bases__ = cls.__bases__ + (GenerationMixin,)
+    if model is not None:
+        # fix missing generate method for InternVL-2.5 models when using transformers >= 4.50
+        llm_part = getattr(model, 'language_model', model)
+        if not hasattr(llm_part, 'generate'):
+            logger.info("Detected missing 'generate' method (transformers >= 4.50). Injecting GenerationMixin...")
+
+            cls = llm_part.__class__
+            if GenerationMixin not in cls.__bases__:
+                cls.__bases__ = cls.__bases__ + (GenerationMixin,)
+
-    if model is not None:
-            # fix missing generate method for InternVL-2.5 models when using transformers >= 4.50
-            llm_part = getattr(model, 'language_model', model)  
-            if not hasattr(llm_part, 'generate'): 
-                print("Detected missing 'generate' method (transformers >= 4.50). Injecting GenerationMixin...")
-                
-                cls = llm_part.__class__
-                if GenerationMixin not in cls.__bases__:
-                    cls.__bases__ = cls.__bases__ + (GenerationMixin,)
+    if model is not None:
+        # fix missing generate method for InternVL-2.5 models when using transformers >= 4.50
+        llm_part = getattr(model, 'language_model', model)
+        if not hasattr(llm_part, 'generate'):
+            logger.info("Detected missing 'generate' method (transformers >= 4.50). Injecting GenerationMixin...")
+
+            cls = llm_part.__class__
+            if GenerationMixin not in cls.__bases__:
+                cls.__bases__ = cls.__bases__ + (GenerationMixin,)
+
     return model, tokenizer