自定義 API

也被稱為 BYOK（Bring Your Own Key）。本指南用於指導你為 WriteTex 獲取自定義 AI 接口。如果你已經熟悉相關流程，可以跳過本指南。以下是逐步配置指南。

免責聲明

WriteTex（我們）不對使用自定義 API 產生的任何費用負責。你必須遵守所選 AI 服務提供商的服務條款以及所在法域的法律。我們不對模型產生的結果負責，也不與這些公司存在從屬關係。詳情請參閱我們的使用條款。

名詞解釋

OpenAI 兼容 API：遵循 OpenAI API 規範的接口。WriteTex 期望你的接口為此格式。
API Endpoint/Base URL：接口的基地址，即服務托管的根 URL。例如 https://api.openai.com/v1。
API Token/Key：用於請求鑒權的密鑰，需妥善保密。例如 sk-1234567890。
Model Name/ID：在 WriteTex 中使用的模型名稱或標識。例如 gpt-5.1、qwen/qwen3-vl-8b-instruct。該參數應為精確的模型 ID，不要填寫模糊值如 gpt 或 qwen。
API 版本：所用接口的版本。WriteTex 在 Windows、Android、MacOS 上期望版本為 v1。如果 Base URL 以 /v1 結尾，那麼在這些平台的設置裏應去掉 /v1。關於 Base URL 與版本的更多信息，請參閱各平台指南。
API 服務提供商：提供接口服務的公司，通常是 OpenAI、阿里巴巴、Anthropic、騰訊、Google、字節跳動等。
多模態/視覺語言模型：同時支持文本與圖像輸入的模型。例如 gpt-5.1。
Token：模型處理文本的基本計量單位。每次請求會根據輸入與輸出消耗對應數量的 tokens，費用通常為輸入與輸出分別計價。示例：gpt-5.1 的定價為輸入 $1.25/100 萬 tokens、輸出 $10/100 萬 tokens。

選擇服務商與模型

選擇時可考慮以下因素：

性能：在 OCR 任務上的表現，可參考 LMArena 排行。
成本：不同模型價格差異較大。費用計算：

輸入 Token 數 * 輸入單價 + 輸出 Token 數 * 輸出單價

模型能力：模型需支持視覺輸入，即為多模態模型。例如 gpt-5.1。具體以各服務商官網為準。

如何判斷模型是否支持視覺輸入？
查看模型描述，通常會包含 "vision" 或 "multi-modal" 等關鍵詞。
在服務商官網查看模型卡片，通常會有圖標指示模型支持圖像輸入。

以下是一些值得考慮的服務商與模型：

服務商	性價比模型	價格（入/出）	高性能模型	價格（入/出）
OpenAI	gpt5 mini	$0.25 /$2	gpt 5.1	$1.25/$10
Anthropic	claude sonnet 4.5	$3/$15	claude opus 4.5	$5/$25
Google	gemini 2.5 flash	$0.3/$2.5	gemini 3 flash	$0.5/$3
Openrouter	nvidia/nemotron-nano-12b-v2-vl:free	0	grok 4	$3/$15
阿里巴巴	qwen3 vl flash	¥0.15/¥1.5	qwen3 vl plus	¥1/¥10
騰訊	hunyuan turbos vision	¥3/¥9	hunyuan t1 vision	¥3/¥9
字節跳動	doubao seed 1.6 flash	¥0.15/¥1.5	doubao seed 1.6 vision	¥0.8/¥8

1 美元 ≈ 7.1 人民幣
價格以每百萬 token 顯示。

在 WriteTex 中的識別任務通常每次消耗約 300 - 1000 個輸入 token 和 10 - 100 個輸出 token。

多數服務商提供較為寬鬆的免費額度，通常註冊即可開始免費試用模型。

獲取 API 配置

一套可用的配置需要以下三項：

API Endpoint
API Key
Model ID

Base URL 通常可在服務商文檔中找到。獲取 API Key 與 Model ID 的一般流程：

在服務商平台註冊賬戶。
閱讀服務商的文檔。
在服務商平台創建 API token。
選擇模型並記錄 Model ID。

OpenAI

註冊 OpenAI 賬戶。
閱讀 OpenAI API 文檔。
在 OpenAI Platform 創建 token。
選擇模型，例如 GPT 5.1，模型 ID gpt-5.1。

Base URL：https://api.openai.com/v1

Anthropic

註冊 Anthropic 控制台賬戶。
閱讀 Anthropic API 文檔。
在 Anthropic Platform 創建 token。
在模型總覽選擇模型，例如 Claude Sonnet 4.5，模型 ID claude-sonnet-4-5。

Base URL：https://api.anthropic.com/v1

Google

註冊 Google 賬號。登錄 Google AI Studio。
閱讀 Gemini API 文檔。
在 Google AI Studio 創建 token。
選擇模型，例如 Gemini 2.5 Flash，模型 ID gemini-2.5-flash。

Base URL：https://generativelanguage.googleapis.com/v1beta/openai

你也可以在 Google Vertex AI 使用 gemini API。

Google 在 Google AI Studio 提供免費的 gemini 2.5 flash，每日限額 20 次請求。

Openrouter

Openrouter 是一個聚合路由平台，可使用來自多個服務商的模型。詳情請參閱 Openrouter 文檔。

Openrouter 上經常有免費模型。例如 nvidia/nemotron-nano-12b-v2-vl:free 是一個可以零成本使用的免費模型。 Base URL：https://openrouter.ai/api/v1

阿里巴巴

在阿里云註冊賬戶。
閱讀阿里云 API 文檔。
按照此指南在 API Key 創建 API 密鑰。
在模型市場選擇模型。例如 Qwen3 vl plus，模型 ID qwen3-vl-plus。

Base URL：https://dashscope.aliyuncs.com/compatible-mode/v1

新註冊用戶通常在前三個月每個模型可獲 100 萬 tokens 免費額度。

騰訊

註冊騰訊雲賬戶。
閱讀騰訊雲 API 文檔。
在騰訊雲控制台創建 API 密鑰。
在模型廣場選擇模型，例如 Hunyuan Turbos Vision，模型 ID hunyuan-turbos-vision。

Base URL：https://api.hunyuan.cloud.tencent.com/v1

新註冊用戶可獲總計約 100 萬 tokens 的免費額度（各模型共享）。

字節跳動

註冊火山引擎賬戶。
閱讀火山引擎 API 文檔。
在火山引擎控制台創建 API 密鑰。
在模型廣場選擇模型，例如 Doubao 1.6 Vision，模型 ID doubao-seed-1-6-vision-250815。

Base URL：https://ark.cn-beijing.volces.com/api/v3

新註冊用戶每個模型可獲約 50 萬 tokens 的免費額度。

關於 Deepseek

Deepseek 官方直接提供的模型不支持視覺輸入。DeepSeek-OCR 等開源模型支持識別數學公式，但需要自行部署或尋找第三方服務商。

測試你的 API（如果需要）

假設你已經獲得了 API Key 和 Model ID。你可以使用 CherryStudio 等工具測試你的 API。下載 Cherry Studio 應用，並在應用中使用你的 API 設置進行測試。嘗試插入圖片以查看模型是否支持視覺輸入。

如果你不想下載應用，也可以通過發送簡單請求來測試 API。以下是使用 curl 的 qwen3-vl-plus 請求示例。將此命令複製並粘貼到你的終端或 CMD 中：

bash

curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
  -H "Authorization: Bearer sk-1234567890" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-vl-plus",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "你好"
          }
        ]
      }
    ]
  }'

將 https://dashscope.aliyuncs.com/compatible-mode/v1 替換為你自己的 Base URL，保留 /chat/completions 部分。將 qwen3-vl-plus 替換為你自己的 Model ID。將 sk-1234567890 替換為你自己的 API Key。

成功響應：

json

{
    "choices": [
        {
            "message": {
                "content": "你好！今天有什麼可以幫到你的嗎？😊",
                "reasoning_content": "",
                "role": "assistant"
            },
        }
    ],
}

在 WriteTex 中配置

進階

在本部分，作者假設讀者具備相關背景知識。自行部署自定義模型超出了本指南的範圍。不建議初學者或沒有計算機科學背景的用戶嘗試。

自行部署

ollama 是一個可以在本地運行大模型的平台。它提供了一個簡潔的 API。詳情請參閱 ollama 文檔。例如，Deepseek-OCR 是一個可以在 WriteTex 中使用的模型。

vLLM 是一個高性能的推論引擎。它支持多種模型並提供 OpenAI 兼容接口。詳情請參閱 vLLM 文檔。推薦嘗試 HunyuanOCR 和 DeepSeek-OCR 以獲得輕量快速的本地 LaTeX OCR。

自定義 API ​

免責聲明 ​

名詞解釋 ​

選擇服務商與模型 ​

獲取 API 配置 ​

OpenAI ​

Anthropic ​

Google ​

Openrouter ​

阿里巴巴 ​

騰訊 ​

字節跳動 ​

關於 Deepseek ​

測試你的 API（如果需要） ​

在 WriteTex 中配置 ​

進階 ​

自行部署 ​