问题
有时候项目需要在内网部署,这样 sentence_transformers 就不能自己去下载对应名称的模型了
思路
模型提前下载好放在本地,加载模型的时候直接指定本地模型缓存路径
解决办法
- 比如我需要加载 allenai-specter 模型,那么我就在有外网的地方执行一遍此代码,sentence_transformers 会自动下载 allenai-specter 模型到指定的缓存目录【D:\hugface-model\allenai-specter】
from sentence_transformers import SentenceTransformer
model = SentenceTransformer(
'all-mpnet-base-v2',
cache_folder=r"D:\hugface-model\allenai-specter"
)
corpus_embeddings = model.encode("爱你孤身走暗巷,爱你不贵的模样,爱你...", convert_to_tensor=True)
print(corpus_embeddings)
- 然后到上面的缓存目录【D:\hugface-model\allenai-specter】

将模型复制一份放到线上内网环境上,比如放到了线上的 /model/allenai-specter 目录下,那么线上加载模型的方法就改成这样即可
model = SentenceTransformer(
'allenai-specter',
cache_folder=r"/model/allenai-specter"