自定義 API
也被稱為 BYOK(Bring Your Own Key)。本指南用於指導你為 WriteTex 獲取自定義 AI 接口。如果你已經熟悉相關流程,可以跳過本指南。以下是逐步配置指南。
免責聲明
WriteTex(我們)不對使用自定義 API 產生的任何費用負責。你必須遵守所選 AI 服務提供商的服務條款以及所在法域的法律。我們不對模型產生的結果負責,也不與這些公司存在從屬關係。詳情請參閱我們的使用條款。
名詞解釋
- OpenAI 兼容 API:遵循 OpenAI API 規範的接口。WriteTex 期望你的接口為此格式。
- API Endpoint/Base URL:接口的基地址,即服務托管的根 URL。例如
https://api.openai.com/v1。 - API Token/Key:用於請求鑒權的密鑰,需妥善保密。例如
sk-1234567890。 - Model Name/ID:在 WriteTex 中使用的模型名稱或標識。例如
gpt-5.1、qwen/qwen3-vl-8b-instruct。該參數應為精確的模型 ID,不要填寫模糊值如gpt或qwen。 - API 版本:所用接口的版本。WriteTex 在 Windows、Android、MacOS 上期望版本為
v1。如果 Base URL 以/v1結尾,那麼在這些平台的設置裏應去掉/v1。關於 Base URL 與版本的更多信息,請參閱各平台指南。 - API 服務提供商:提供接口服務的公司,通常是 OpenAI、阿里巴巴、Anthropic、騰訊、Google、字節跳動等。
- 多模態/視覺語言模型:同時支持文本與圖像輸入的模型。例如
gpt-5.1。 - Token:模型處理文本的基本計量單位。每次請求會根據輸入與輸出消耗對應數量的 tokens,費用通常為輸入與輸出分別計價。示例:
gpt-5.1的定價為 輸入 $1.25/100 萬 tokens、輸出 $10/100 萬 tokens。
選擇服務商與模型
選擇時可考慮以下因素:
- 性能:在 OCR 任務上的表現,可參考 LMArena 排行。
- 成本:不同模型價格差異較大。費用計算:
輸入 Token 數 * 輸入單價 + 輸出 Token 數 * 輸出單價
- 模型能力:模型需支持視覺輸入,即為多模態模型。例如
gpt-5.1。具體以各服務商官網為準。
如何判斷模型是否支持視覺輸入?
- 查看模型描述,通常會包含 "vision" 或 "multi-modal" 等關鍵詞。
- 在服務商官網查看模型卡片,通常會有圖標指示模型支持圖像輸入。
以下是一些值得考慮的服務商與模型:
| 服務商 | 性價比模型 | 價格(入/出) | 高性能模型 | 價格(入/出) |
|---|---|---|---|---|
| OpenAI | gpt5 mini | $0.25 /$2 | gpt 5.1 | $1.25/$10 |
| Anthropic | claude sonnet 4.5 | $3/$15 | claude opus 4.5 | $5/$25 |
| gemini 2.5 flash | $0.3/$2.5 | gemini 3 flash | $0.5/$3 | |
| Openrouter | nvidia/nemotron-nano-12b-v2-vl:free | 0 | grok 4 | $3/$15 |
| 阿里巴巴 | qwen3 vl flash | ¥0.15/¥1.5 | qwen3 vl plus | ¥1/¥10 |
| 騰訊 | hunyuan turbos vision | ¥3/¥9 | hunyuan t1 vision | ¥3/¥9 |
| 字節跳動 | doubao seed 1.6 flash | ¥0.15/¥1.5 | doubao seed 1.6 vision | ¥0.8/¥8 |
- 1 美元 ≈ 7.1 人民幣
- 價格以每百萬 token 顯示。
在 WriteTex 中的識別任務通常每次消耗約 300 - 1000 個輸入 token 和 10 - 100 個輸出 token。
多數服務商提供較為寬鬆的免費額度,通常註冊即可開始免費試用模型。
獲取 API 配置
一套可用的配置需要以下三項:
- API Endpoint
- API Key
- Model ID
Base URL 通常可在服務商文檔中找到。 獲取 API Key 與 Model ID 的一般流程:
- 在服務商平台註冊賬戶。
- 閱讀服務商的文檔。
- 在服務商平台創建 API token。
- 選擇模型並記錄 Model ID。
OpenAI
- 註冊 OpenAI 賬戶。
- 閱讀 OpenAI API 文檔。
- 在 OpenAI Platform 創建 token。
- 選擇模型,例如 GPT 5.1,模型 ID
gpt-5.1。
Base URL:https://api.openai.com/v1
Anthropic
- 註冊 Anthropic 控制台賬戶。
- 閱讀 Anthropic API 文檔。
- 在 Anthropic Platform 創建 token。
- 在模型總覽選擇模型,例如 Claude Sonnet 4.5,模型 ID
claude-sonnet-4-5。
Base URL:https://api.anthropic.com/v1
Google
- 註冊 Google 賬號。登錄 Google AI Studio。
- 閱讀 Gemini API 文檔。
- 在 Google AI Studio 創建 token。
- 選擇模型,例如 Gemini 2.5 Flash,模型 ID
gemini-2.5-flash。
Base URL:https://generativelanguage.googleapis.com/v1beta/openai
你也可以在 Google Vertex AI 使用 gemini API。
Google 在 Google AI Studio 提供免費的 gemini 2.5 flash,每日限額 20 次請求。
Openrouter
Openrouter 是一個聚合路由平台,可使用來自多個服務商的模型。詳情請參閱 Openrouter 文檔。
Openrouter 上經常有免費模型。例如
nvidia/nemotron-nano-12b-v2-vl:free是一個可以零成本使用的免費模型。 Base URL:https://openrouter.ai/api/v1
阿里巴巴
- 在 阿里云 註冊賬戶。
- 閱讀 阿里云 API 文檔。
- 按照此指南在 API Key 創建 API 密鑰。
- 在模型市場選擇模型。例如 Qwen3 vl plus,模型 ID
qwen3-vl-plus。
Base URL:https://dashscope.aliyuncs.com/compatible-mode/v1
新註冊用戶通常在前三個月每個模型可獲 100 萬 tokens 免費額度。
騰訊
- 註冊 騰訊雲 賬戶。
- 閱讀 騰訊雲 API 文檔。
- 在騰訊雲控制台創建 API 密鑰。
- 在模型廣場選擇模型,例如 Hunyuan Turbos Vision,模型 ID
hunyuan-turbos-vision。
Base URL:https://api.hunyuan.cloud.tencent.com/v1
新註冊用戶可獲總計約 100 萬 tokens 的免費額度(各模型共享)。
字節跳動
- 註冊 火山引擎 賬戶。
- 閱讀 火山引擎 API 文檔。
- 在火山引擎控制台創建 API 密鑰。
- 在模型廣場選擇模型,例如 Doubao 1.6 Vision,模型 ID
doubao-seed-1-6-vision-250815。
Base URL:https://ark.cn-beijing.volces.com/api/v3
新註冊用戶每個模型可獲約 50 萬 tokens 的免費額度。
關於 Deepseek
Deepseek 官方直接提供的模型不支持視覺輸入。DeepSeek-OCR 等開源模型支持識別數學公式,但需要自行部署或尋找第三方服務商。
測試你的 API(如果需要)
假設你已經獲得了 API Key 和 Model ID。你可以使用 CherryStudio 等工具測試你的 API。下載 Cherry Studio 應用,並在應用中使用你的 API 設置進行測試。嘗試插入圖片以查看模型是否支持視覺輸入。
如果你不想下載應用,也可以通過發送簡單請求來測試 API。以下是使用 curl 的 qwen3-vl-plus 請求示例。將此命令複製並粘貼到你的終端或 CMD 中:
curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-1234567890" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-vl-plus",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "你好"
}
]
}
]
}'將 https://dashscope.aliyuncs.com/compatible-mode/v1 替換為你自己的 Base URL,保留 /chat/completions 部分。 將 qwen3-vl-plus 替換為你自己的 Model ID。 將 sk-1234567890 替換為你自己的 API Key。
成功響應:
{
"choices": [
{
"message": {
"content": "你好!今天有什麼可以幫到你的嗎?😊",
"reasoning_content": "",
"role": "assistant"
},
}
],
}在 WriteTex 中配置
進階
在本部分,作者假設讀者具備相關背景知識。自行部署自定義模型超出了本指南的範圍。不建議初學者或沒有計算機科學背景的用戶嘗試。
自行部署
ollama 是一個可以在本地運行大模型的平台。它提供了一個簡潔的 API。詳情請參閱 ollama 文檔。例如,Deepseek-OCR 是一個可以在 WriteTex 中使用的模型。
vLLM 是一個高性能的推論引擎。它支持多種模型並提供 OpenAI 兼容接口。詳情請參閱 vLLM 文檔。推薦嘗試 HunyuanOCR 和 DeepSeek-OCR 以獲得輕量快速的本地 LaTeX OCR。