+ fix NomicBertModel

noooop · noooop · commit d30f5075be92 · 2025-07-29T08:41:30.000+08:00
Signed-off-by: wang.yuqi &lt;noooop@126.com&gt;
diff --git a/vllm/model_executor/models/bert_with_rope.py b/vllm/model_executor/models/bert_with_rope.py
@@ -22,7 +22,6 @@
 from vllm.model_executor.layers.vocab_parallel_embedding import (
     VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
-from vllm.model_executor.models import SupportsV0Only
 from vllm.model_executor.models.interfaces import SupportsQuant
 from vllm.model_executor.models.utils import WeightsMapper
 from vllm.sequence import IntermediateTensors
@@ -466,7 +465,7 @@ def load_weights(self, weights: Iterable[tuple[str,
         return loaded_params
 
 
-class NomicBertModel(BertWithRope, SupportsV0Only):
+class NomicBertModel(BertWithRope):
     # for https://huggingface.co/nomic-ai/nomic-bert-2048
 
     hf_to_vllm_mapper = WeightsMapper(
diff --git a/vllm/model_executor/models/config.py b/vllm/model_executor/models/config.py
@@ -93,7 +93,7 @@ def verify_and_update_config(vllm_config: "VllmConfig") -> None:
         config.num_hidden_layers = config.n_layer
 
         head_dim = config.hidden_size // config.num_attention_heads
-        rotary_emb_dim = head_dim * config.rotary_emb_fraction
+        rotary_emb_dim = int(head_dim * config.rotary_emb_fraction)
         max_trained_positions = getattr(config, "max_trained_positions", 2048)
         config.rotary_kwargs = {
             "head_size": head_dim,