Пользовательский API

Также известен как BYOK (Bring Your Own Key — принесите свой собственный ключ). Это руководство поможет вам получить и настроить токен пользовательского AI API для WriteTex. Если вы уже знакомы с этим процессом, можете пропустить это руководство. Для использования WriteTex требуется настройка пользовательского AI API. Ниже приведено пошаговое руководство по настройке.

Отказ от ответственности

WriteTex (мы) не несет ответственности за любые расходы, понесенные в результате использования пользовательского API. Вы должны соблюдать условия обслуживания поставщика услуг AI API и действующее законодательство вашей юрисдикции. Мы не несем ответственности за результаты, генерируемые моделями вашего поставщика. Мы не связаны с этими компаниями. Для получения дополнительной информации ознакомьтесь с нашими Условиями использования.

Определения

OpenAI-совместимый API: API, совместимый со спецификацией API OpenAI. WriteTex ожидает, что ваша конечная точка API будет в этом формате.
Конечная точка API / Базовый URL (Base URL): Базовый URL вашей конечной точки API. Это корневой URL-адрес, по которому размещен ваш API. Например, https://api.openai.com/v1.
API-токен / Ключ: Уникальный идентификатор, используемый для аутентификации запросов к вашему API. Его следует хранить в секрете и не передавать публично. Например, sk-1234567890.
Имя модели / ID: Имя или идентификатор модели, которую вы хотите использовать с WriteTex. Например, gpt-5.1, qwen/qwen3-vl-8b-instruct. Это уникальный параметр, который не допускает расплывчатых входных данных, таких как gpt или qwen.
Версия API: Версия API, которую вы используете. WriteTex ожидает версию v1 на Windows, Android и macOS. Если Базовый URL заканчивается на /v1, вам следует удалить /v1 из вашего базового URL на устройствах Windows, Android и macOS. Дополнительную информацию о базовом URL и версии API см. в руководстве для конкретной платформы.
Поставщик услуг API: Поставщик услуг, который хостит ваш API. Обычно это известные технологические гиганты, такие как OpenAI, Alibaba, Anthropic, Tencent, Google, ByteDance и др.
Зрительно-языковые модели / Мультимодальные модели: Эти модели способны понимать текст и изображения. Обычно они мощнее традиционных языковых моделей. Например, gpt-5.1 — это мультимодальная модель.
Токены: Токены — это базовые единицы текста, которые обрабатывает модель. При каждом запросе вы потребляете определенное количество токенов в зависимости от ваших входных данных и выходных данных модели. Количество потребляемых токенов пропорционально стоимости запроса. Обычно токены на входе и выходе оцениваются по-разному. Например, у gpt-5.1 цена составляет 1,25 доллара за 1 млн токенов на входе и 10 долларов за 1 млн токенов на выходе.

Выбор поставщика и модели

При выборе поставщика и модели учитывайте следующие факторы:

Производительность: Ищите модели, которые хорошо справляются с задачами OCR. Дополнительную информацию см. в рейтинге LMArena.
Стоимость: Сравните стоимость использования различных моделей. Некоторые модели могут быть дороже других. Затраты рассчитываются по формуле:

Количество входных токенов * Цена на входе + Количество выходных токенов * Цена на выходе.

Возможности модели: Ваша модель должна поддерживать визуальный ввод, то есть быть мультимодальной. Например, gpt-5.1 — это мультимодальная модель. Дополнительную информацию можно найти на веб-сайте поставщика.

Как проверить, поддерживает ли модель визуальный ввод?
Ищите модели с пометкой «vision» или «multi-modal» в их описании.
Проверьте карточку модели на веб-сайте поставщика. Обычно там есть значок, указывающий на поддержку ввода изображений.

Вот некоторые поставщики и модели, которые стоит рассмотреть:

Поставщик	Бюджетная модель	Цена (Вход/Выход)	Производительная модель	Цена (Вход/Выход)
OpenAI	gpt5 mini	0,25 $ / 2 $	gpt 5.1	1,25 $ / 10 $
Anthropic	claude sonnet 4.5	3 $ / 15 $	claude opus 4.5	5 $ / 25 $
Google	gemini 2.5 flash	0,3 $ / 2,5 $	gemini 3 flash	0,5 $ / 3 $
Openrouter	nvidia/nemotron-nano-12b-v2-vl:free	0	grok 4	3 $ / 15 $
Alibaba	qwen3 vl flash	0,15 ¥ / 1,5 ¥	qwen3 vl plus	1 ¥ / 10 ¥
Tencent	hunyuan turbos vision	3 ¥ / 9 ¥	hunyuan t1 vision	3 ¥ / 9 ¥
ByteDance	doubao seed 1.6 flash	0,15 ¥ / 1,5 ¥	doubao seed 1.6 vision	0,8 ¥ / 8 ¥

1 доллар США ≈ 7,1 китайского юаня
Цены указаны за миллион токенов.

На каждый запрос во WriteTex вы обычно тратите от 300 до 1000 входных токенов и от 10 до 100 выходных токенов.

Большинство поставщиков моделей предлагают щедрый бесплатный уровень. Обычно вы можете зарегистрировать бесплатную учетную запись и начать использовать модели без каких-либо затрат.

Получение конфигурации API

Для конфигурации API вам необходимы три компонента:

Конечная точка API (API Endpoint)
API-ключ
ID модели

Базовый URL-адрес обычно можно найти в документации поставщика. Получение API-ключа и ID модели также довольно просто:

Зарегистрируйте учетную запись у поставщика.
Прочтите документацию поставщика.
Создайте API-токен на платформе поставщика.
Выберите свою модель и получите ID модели.

OpenAI

Зарегистрируйте учетную запись OpenAI.
Прочтите документацию OpenAI API.
Создайте токен на платформе OpenAI.
Выберите модель, например GPT 5.1 с идентификатором модели gpt-5.1.

Базовый URL: https://api.openai.com/v1

Anthropic

Зарегистрируйте учетную запись в консоли Anthropic.
Прочтите документацию Anthropic API.
Создайте токен на платформе Anthropic.
Выберите модель в обзоре моделей, например Claude Sonnet 4.5 с идентификатором модели claude-sonnet-4-5.

Базовый URL: https://api.anthropic.com/v1

Google

Зарегистрируйте учетную запись Google. Войдите в Google AI Studio.
Прочтите документацию Gemini API.
Создайте токен в Google AI Studio.
Выберите модель, например Gemini 2.5 Flash с идентификатором модели gemini-2.5-flash.

Базовый URL: https://generativelanguage.googleapis.com/v1beta/openai

Вы также можете использовать Gemini API в Google Vertex AI.

Google предлагает Gemini 2.5 Flash бесплатно с дневным лимитом 20 запросов в Google AI Studio.

Openrouter

Openrouter — это платформа-агрегатор, позволяющая использовать модели нескольких поставщиков. См. документацию Openrouter.

На платформе часто доступны бесплатные модели, такие как nvidia/nemotron-nano-12b-v2-vl:free, которые можно использовать без затрат.

Базовый URL: https://openrouter.ai/api/v1

Alibaba

Зарегистрируйте учетную запись Aliyun на Aliyun
Прочтите документацию Aliyun API
Следуйте этому руководству, чтобы создать API-ключ в разделе API Key
Выберите модель в Model Market. Например, Qwen3 vl plus с ID модели qwen3-vl-plus

Base URL: https://dashscope.aliyuncs.com/compatible-mode/v1

Для новых зарегистрированных пользователей предоставляется бесплатная квота в 1 млн токенов для каждой модели в течение первых трех месяцев.

Tencent

Зарегистрируйте учетную запись Tencent Cloud
Прочтите документацию Tencent API
Создайте API-ключ в консоли Tencent Cloud
Выберите модель в Model Square, например, Hunyuan Turbos Vision с ID модели hunyuan-turbos-vision.

Base URL: https://api.hunyuan.cloud.tencent.com/v1

Для новых зарегистрированных пользователей предоставляется бесплатная квота в 1 млн токенов в сумме для всех моделей.

ByteDance

Зарегистрируйте учетную запись Volc Engine
Прочтите документацию Volc Engine API
Создайте API-ключ в консоли Volc Engine
Выберите модель в Model Square, например, Doubao 1.6 Vision с ID модели doubao-seed-1-6-vision-250815.

Base URL: https://ark.cn-beijing.volces.com/api/v3

Для новых зарегистрированных пользователей предоставляется бесплатная квота в 0,5 млн токенов на каждую модель.

О Deepseek

Модели, предоставляемые напрямую Deepseek, не поддерживают визуальный ввод. Модели с открытым исходным кодом, такие как DeepSeek-OCR, поддерживают распознавание математических формул, но требуют самостоятельного хостинга или поиска отдельного поставщика.

Протестируйте ваш API (если необходимо)

Предположим, вы получили API-ключ и ID модели. Вы можете протестировать свой API с помощью такого инструмента, как CherryStudio. Загрузите приложение CherryStudio и используйте настройки вашего API в приложении для тестирования. Попробуйте вставить изображение, чтобы проверить, поддерживает ли модель визуальный ввод.

Если вы не хотите скачивать приложение, вы также можете протестировать свой API, отправив простой запрос. Вот пример запроса для qwen3-vl-plus с использованием curl. Скопируйте и вставьте эту команду в терминал или командную строку:

bash

curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
  -H "Authorization: Bearer sk-1234567890" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-vl-plus",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "Привет"
          }
        ]
      }
    ]
  }'

Замените https://dashscope.aliyuncs.com/compatible-mode/v1 на ваш собственный Base URL, оставив часть /chat/completions без изменений. Замените qwen3-vl-plus на ваш ID модели. Замените sk-1234567890 на ваш API-ключ.

Успешный ответ:

json

{
    "choices": [
        {
            "message": {
                "content": "Привет! Чем я могу вам помочь сегодня? 😊",
                "reasoning_content": "",
                "role": "assistant"
            },
        }
    ],
}

Настройка во WriteTex

Пожалуйста, следуйте руководству для конкретной платформы, чтобы завершить настройку:

Дополнительно

В этой части авторы предполагают, что читатель понимает, что делает. Хостинг собственной модели выходит за рамки данного руководства. Это не рекомендуется для начинающих или пользователей без опыта в области компьютерных наук.

Самостоятельный хостинг

ollama — это платформа, позволяющая запускать большие языковые модели на вашей собственной машине. Она предоставляет простой API для запуска моделей. Дополнительную информацию см. в документации ollama. В качестве примера: Deepseek-OCR — это модель, которую вы можете использовать для WriteTex.

vLLM — это высокопроизводительный движок инференса для больших языковых моделей. Он поддерживает множество моделей и предоставляет OpenAI-совместимый API. Дополнительную информацию см. в документации vLLM. Рекомендуем попробовать HunyuanOCR и DeepSeek-OCR для быстрого и легкого локального распознавания LaTeX для WriteTex.

Пользовательский API ​

Отказ от ответственности ​

Определения ​

Выбор поставщика и модели ​

Получение конфигурации API ​

OpenAI ​

Anthropic ​

Google ​

Openrouter ​

Alibaba ​

Tencent ​

ByteDance ​

О Deepseek ​

Протестируйте ваш API (если необходимо) ​

Настройка во WriteTex ​

Дополнительно ​

Самостоятельный хостинг ​