Embeddings
OpenAI 兼容向量请求使用 POST /v1/embeddings。
curl https://llmoxy.com/v1/embeddings \
-H "Authorization: Bearer <LLMOXY_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-3-small",
"input": ["first document", "second document"],
"encoding_format": "float"
}'
常用字段:
| 字段 | 说明 |
|---|---|
model | 必填,Embedding 模型 ID。 |
input | 字符串或字符串数组。 |
encoding_format | 上游支持时可为 float 或 base64。 |
dimensions | 支持的模型可指定输出维度。 |
user | 可选跟踪标识。 |
Gemini 风格 Embedding 请求可使用:
POST /v1/engines/{model}/embeddings
Rerank
使用 POST /v1/rerank 调用 Jina、Cohere 等 Rerank 模型。
curl https://llmoxy.com/v1/rerank \
-H "Authorization: Bearer <LLMOXY_API_KEY>" \
-H "Content-Type: application/json" \
-d '{
"model": "jina-reranker-v2-base-multilingual",
"query": "What is LLMoxy?",
"documents": [
"LLMoxy is an LLM gateway.",
"A database stores rows."
],
"top_n": 1,
"return_documents": true
}'
常用字段:
| 字段 | 说明 |
|---|---|
model | 必填,Rerank 模型 ID。 |
query | 查询文本。 |
documents | 字符串或文档对象数组。 |
top_n | 最多返回的排序结果数。 |
return_documents | 是否在响应中包含原始文档。 |
