Skip to content

自定義 API

也被稱為 BYOK(Bring Your Own Key)。本指南用於指導你為 WriteTex 獲取自定義 AI 接口。如果你已經熟悉相關流程,可以跳過本指南。以下是逐步配置指南。

免責聲明

WriteTex(我們)不對使用自定義 API 產生的任何費用負責。你必須遵守所選 AI 服務提供商的服務條款以及所在法域的法律。我們不對模型產生的結果負責,也不與這些公司存在從屬關係。詳情請參閱我們的使用條款

名詞解釋

  1. OpenAI 兼容 API:遵循 OpenAI API 規範的接口。WriteTex 期望你的接口為此格式。
  2. API Endpoint/Base URL:接口的基地址,即服務托管的根 URL。例如 https://api.openai.com/v1
  3. API Token/Key:用於請求鑒權的密鑰,需妥善保密。例如 sk-1234567890
  4. Model Name/ID:在 WriteTex 中使用的模型名稱或標識。例如 gpt-5.1qwen/qwen3-vl-8b-instruct。該參數應為精確的模型 ID,不要填寫模糊值如 gptqwen
  5. API 版本:所用接口的版本。WriteTex 在 Windows、Android、MacOS 上期望版本為 v1。如果 Base URL/v1 結尾,那麼在這些平台的設置裏應去掉 /v1。關於 Base URL 與版本的更多信息,請參閱各平台指南。
  6. API 服務提供商:提供接口服務的公司,通常是 OpenAI、阿里巴巴、Anthropic、騰訊、Google、字節跳動等。
  7. 多模態/視覺語言模型:同時支持文本與圖像輸入的模型。例如 gpt-5.1
  8. Token:模型處理文本的基本計量單位。每次請求會根據輸入與輸出消耗對應數量的 tokens,費用通常為輸入與輸出分別計價。示例:gpt-5.1 的定價為 輸入 $1.25/100 萬 tokens、輸出 $10/100 萬 tokens。

選擇服務商與模型

選擇時可考慮以下因素:

  1. 性能:在 OCR 任務上的表現,可參考 LMArena 排行
  2. 成本:不同模型價格差異較大。費用計算:

輸入 Token 數 * 輸入單價 + 輸出 Token 數 * 輸出單價

  1. 模型能力:模型需支持視覺輸入,即為多模態模型。例如 gpt-5.1。具體以各服務商官網為準。

如何判斷模型是否支持視覺輸入?

  • 查看模型描述,通常會包含 "vision" 或 "multi-modal" 等關鍵詞。
  • 在服務商官網查看模型卡片,通常會有圖標指示模型支持圖像輸入。

以下是一些值得考慮的服務商與模型:

服務商性價比模型價格(入/出)高性能模型價格(入/出)
OpenAIgpt5 mini$0.25 /$2gpt 5.1$1.25/$10
Anthropicclaude sonnet 4.5$3/$15claude opus 4.5$5/$25
Googlegemini 2.5 flash$0.3/$2.5gemini 3 flash$0.5/$3
Openrouternvidia/nemotron-nano-12b-v2-vl:free0grok 4$3/$15
阿里巴巴qwen3 vl flash¥0.15/¥1.5qwen3 vl plus¥1/¥10
騰訊hunyuan turbos vision¥3/¥9hunyuan t1 vision¥3/¥9
字節跳動doubao seed 1.6 flash¥0.15/¥1.5doubao seed 1.6 vision¥0.8/¥8
  • 1 美元 ≈ 7.1 人民幣
  • 價格以每百萬 token 顯示。

在 WriteTex 中的識別任務通常每次消耗約 300 - 1000 個輸入 token 和 10 - 100 個輸出 token。

多數服務商提供較為寬鬆的免費額度,通常註冊即可開始免費試用模型。

獲取 API 配置

一套可用的配置需要以下三項:

  • API Endpoint
  • API Key
  • Model ID

Base URL 通常可在服務商文檔中找到。 獲取 API Key 與 Model ID 的一般流程:

  1. 在服務商平台註冊賬戶。
  2. 閱讀服務商的文檔。
  3. 在服務商平台創建 API token。
  4. 選擇模型並記錄 Model ID

OpenAI

  1. 註冊 OpenAI 賬戶。
  2. 閱讀 OpenAI API 文檔
  3. OpenAI Platform 創建 token。
  4. 選擇模型,例如 GPT 5.1,模型 ID gpt-5.1

Base URL:https://api.openai.com/v1

Anthropic

  1. 註冊 Anthropic 控制台賬戶。
  2. 閱讀 Anthropic API 文檔
  3. Anthropic Platform 創建 token。
  4. 模型總覽選擇模型,例如 Claude Sonnet 4.5,模型 ID claude-sonnet-4-5

Base URL:https://api.anthropic.com/v1

Google

  1. 註冊 Google 賬號。登錄 Google AI Studio
  2. 閱讀 Gemini API 文檔
  3. Google AI Studio 創建 token。
  4. 選擇模型,例如 Gemini 2.5 Flash,模型 ID gemini-2.5-flash

Base URL:https://generativelanguage.googleapis.com/v1beta/openai

你也可以在 Google Vertex AI 使用 gemini API。

Google 在 Google AI Studio 提供免費的 gemini 2.5 flash,每日限額 20 次請求。

Openrouter

Openrouter 是一個聚合路由平台,可使用來自多個服務商的模型。詳情請參閱 Openrouter 文檔

Openrouter 上經常有免費模型。例如 nvidia/nemotron-nano-12b-v2-vl:free 是一個可以零成本使用的免費模型。 Base URL:https://openrouter.ai/api/v1

阿里巴巴

  1. 阿里云 註冊賬戶。
  2. 閱讀 阿里云 API 文檔
  3. 按照此指南API Key 創建 API 密鑰。
  4. 模型市場選擇模型。例如 Qwen3 vl plus,模型 ID qwen3-vl-plus

Base URL:https://dashscope.aliyuncs.com/compatible-mode/v1

新註冊用戶通常在前三個月每個模型可獲 100 萬 tokens 免費額度。

騰訊

  1. 註冊 騰訊雲 賬戶。
  2. 閱讀 騰訊雲 API 文檔
  3. 騰訊雲控制台創建 API 密鑰。
  4. 模型廣場選擇模型,例如 Hunyuan Turbos Vision,模型 ID hunyuan-turbos-vision

Base URL:https://api.hunyuan.cloud.tencent.com/v1

新註冊用戶可獲總計約 100 萬 tokens 的免費額度(各模型共享)。

字節跳動

  1. 註冊 火山引擎 賬戶。
  2. 閱讀 火山引擎 API 文檔
  3. 火山引擎控制台創建 API 密鑰。
  4. 模型廣場選擇模型,例如 Doubao 1.6 Vision,模型 ID doubao-seed-1-6-vision-250815

Base URL:https://ark.cn-beijing.volces.com/api/v3

新註冊用戶每個模型可獲約 50 萬 tokens 的免費額度。

關於 Deepseek

Deepseek 官方直接提供的模型不支持視覺輸入。DeepSeek-OCR 等開源模型支持識別數學公式,但需要自行部署或尋找第三方服務商。

測試你的 API(如果需要)

假設你已經獲得了 API Key 和 Model ID。你可以使用 CherryStudio 等工具測試你的 API。下載 Cherry Studio 應用,並在應用中使用你的 API 設置進行測試。嘗試插入圖片以查看模型是否支持視覺輸入。

如果你不想下載應用,也可以通過發送簡單請求來測試 API。以下是使用 curl 的 qwen3-vl-plus 請求示例。將此命令複製並粘貼到你的終端或 CMD 中:

bash
curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
  -H "Authorization: Bearer sk-1234567890" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-vl-plus",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "你好"
          }
        ]
      }
    ]
  }'

https://dashscope.aliyuncs.com/compatible-mode/v1 替換為你自己的 Base URL,保留 /chat/completions 部分。 將 qwen3-vl-plus 替換為你自己的 Model ID。 將 sk-1234567890 替換為你自己的 API Key。

成功響應:

json
{
    "choices": [
        {
            "message": {
                "content": "你好!今天有什麼可以幫到你的嗎?😊",
                "reasoning_content": "",
                "role": "assistant"
            },
        }
    ],
}

在 WriteTex 中配置

進階

在本部分,作者假設讀者具備相關背景知識。自行部署自定義模型超出了本指南的範圍。不建議初學者或沒有計算機科學背景的用戶嘗試。

自行部署

ollama 是一個可以在本地運行大模型的平台。它提供了一個簡潔的 API。詳情請參閱 ollama 文檔。例如,Deepseek-OCR 是一個可以在 WriteTex 中使用的模型。

vLLM 是一個高性能的推論引擎。它支持多種模型並提供 OpenAI 兼容接口。詳情請參閱 vLLM 文檔。推薦嘗試 HunyuanOCRDeepSeek-OCR 以獲得輕量快速的本地 LaTeX OCR。