logo

Embeddings 与 Rerank

Embeddings

OpenAI 兼容向量请求使用 POST /v1/embeddings

curl https://llmoxy.com/v1/embeddings \
  -H "Authorization: Bearer <LLMOXY_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": ["first document", "second document"],
    "encoding_format": "float"
  }'

常用字段:

字段说明
model必填,Embedding 模型 ID。
input字符串或字符串数组。
encoding_format上游支持时可为 floatbase64
dimensions支持的模型可指定输出维度。
user可选跟踪标识。

Gemini 风格 Embedding 请求可使用:

POST /v1/engines/{model}/embeddings

Rerank

使用 POST /v1/rerank 调用 Jina、Cohere 等 Rerank 模型。

curl https://llmoxy.com/v1/rerank \
  -H "Authorization: Bearer <LLMOXY_API_KEY>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "jina-reranker-v2-base-multilingual",
    "query": "What is LLMoxy?",
    "documents": [
      "LLMoxy is an LLM gateway.",
      "A database stores rows."
    ],
    "top_n": 1,
    "return_documents": true
  }'

常用字段:

字段说明
model必填,Rerank 模型 ID。
query查询文本。
documents字符串或文档对象数组。
top_n最多返回的排序结果数。
return_documents是否在响应中包含原始文档。