基于bge-m3 onnx模型获取稀疏向量
前言
bge-m3 是由 BAAI 在 2024 年推出的一个比较经典的 Embedding 模型,是一个支持多语言的 Embedding 模型,除此之外,它还支持输出稀疏向量和 ColBERT 向量,因此用途比较广泛。按照目前 AI 模型的发展速度(竞争很激烈),这个推出了一年多的模型理应算是个老古董了,实际上到目前为止(2025-9-20),该模型还能在 MTEB Leaderboard 榜单上保持在第 23 位的位置,且在 hugging face 上的月下载量保持在五六百万之多:
不过话又说回来,这大概率是因为 Embedding 模型还没有隔壁 LLM 那么卷,2025 截至目前也就阿里推出的 Qwen3-Embedding 模型很有竞争力;