Пользовательский API
Также известен как BYOK (Bring Your Own Key — принесите свой собственный ключ). Это руководство поможет вам получить и настроить токен пользовательского AI API для WriteTex. Если вы уже знакомы с этим процессом, можете пропустить это руководство. Для использования WriteTex требуется настройка пользовательского AI API. Ниже приведено пошаговое руководство по настройке.
Отказ от ответственности
WriteTex (мы) не несет ответственности за любые расходы, понесенные в результате использования пользовательского API. Вы должны соблюдать условия обслуживания поставщика услуг AI API и действующее законодательство вашей юрисдикции. Мы не несем ответственности за результаты, генерируемые моделями вашего поставщика. Мы не связаны с этими компаниями. Для получения дополнительной информации ознакомьтесь с нашими Условиями использования.
Определения
- OpenAI-совместимый API: API, совместимый со спецификацией API OpenAI. WriteTex ожидает, что ваша конечная точка API будет в этом формате.
- Конечная точка API / Базовый URL (Base URL): Базовый URL вашей конечной точки API. Это корневой URL-адрес, по которому размещен ваш API. Например,
https://api.openai.com/v1. - API-токен / Ключ: Уникальный идентификатор, используемый для аутентификации запросов к вашему API. Его следует хранить в секрете и не передавать публично. Например,
sk-1234567890. - Имя модели / ID: Имя или идентификатор модели, которую вы хотите использовать с WriteTex. Например,
gpt-5.1,qwen/qwen3-vl-8b-instruct. Это уникальный параметр, который не допускает расплывчатых входных данных, таких какgptилиqwen. - Версия API: Версия API, которую вы используете. WriteTex ожидает версию
v1на Windows, Android и macOS. Если Базовый URL заканчивается на/v1, вам следует удалить/v1из вашего базового URL на устройствах Windows, Android и macOS. Дополнительную информацию о базовом URL и версии API см. в руководстве для конкретной платформы. - Поставщик услуг API: Поставщик услуг, который хостит ваш API. Обычно это известные технологические гиганты, такие как OpenAI, Alibaba, Anthropic, Tencent, Google, ByteDance и др.
- Зрительно-языковые модели / Мультимодальные модели: Эти модели способны понимать текст и изображения. Обычно они мощнее традиционных языковых моделей. Например,
gpt-5.1— это мультимодальная модель. - Токены: Токены — это базовые единицы текста, которые обрабатывает модель. При каждом запросе вы потребляете определенное количество токенов в зависимости от ваших входных данных и выходных данных модели. Количество потребляемых токенов пропорционально стоимости запроса. Обычно токены на входе и выходе оцениваются по-разному. Например, у
gpt-5.1цена составляет 1,25 доллара за 1 млн токенов на входе и 10 долларов за 1 млн токенов на выходе.
Выбор поставщика и модели
При выборе поставщика и модели учитывайте следующие факторы:
- Производительность: Ищите модели, которые хорошо справляются с задачами OCR. Дополнительную информацию см. в рейтинге LMArena.
- Стоимость: Сравните стоимость использования различных моделей. Некоторые модели могут быть дороже других. Затраты рассчитываются по формуле:
Количество входных токенов * Цена на входе + Количество выходных токенов * Цена на выходе.
- Возможности модели: Ваша модель должна поддерживать визуальный ввод, то есть быть мультимодальной. Например,
gpt-5.1— это мультимодальная модель. Дополнительную информацию можно найти на веб-сайте поставщика.
Как проверить, поддерживает ли модель визуальный ввод?
- Ищите модели с пометкой «vision» или «multi-modal» в их описании.
- Проверьте карточку модели на веб-сайте поставщика. Обычно там есть значок, указывающий на поддержку ввода изображений.
Вот некоторые поставщики и модели, которые стоит рассмотреть:
| Поставщик | Бюджетная модель | Цена (Вход/Выход) | Производительная модель | Цена (Вход/Выход) |
|---|---|---|---|---|
| OpenAI | gpt5 mini | 0,25 $ / 2 $ | gpt 5.1 | 1,25 $ / 10 $ |
| Anthropic | claude sonnet 4.5 | 3 $ / 15 $ | claude opus 4.5 | 5 $ / 25 $ |
| gemini 2.5 flash | 0,3 $ / 2,5 $ | gemini 3 flash | 0,5 $ / 3 $ | |
| Openrouter | nvidia/nemotron-nano-12b-v2-vl:free | 0 | grok 4 | 3 $ / 15 $ |
| Alibaba | qwen3 vl flash | 0,15 ¥ / 1,5 ¥ | qwen3 vl plus | 1 ¥ / 10 ¥ |
| Tencent | hunyuan turbos vision | 3 ¥ / 9 ¥ | hunyuan t1 vision | 3 ¥ / 9 ¥ |
| ByteDance | doubao seed 1.6 flash | 0,15 ¥ / 1,5 ¥ | doubao seed 1.6 vision | 0,8 ¥ / 8 ¥ |
- 1 доллар США ≈ 7,1 китайского юаня
- Цены указаны за миллион токенов.
На каждый запрос во WriteTex вы обычно тратите от 300 до 1000 входных токенов и от 10 до 100 выходных токенов.
Большинство поставщиков моделей предлагают щедрый бесплатный уровень. Обычно вы можете зарегистрировать бесплатную учетную запись и начать использовать модели без каких-либо затрат.
Получение конфигурации API
Для конфигурации API вам необходимы три компонента:
- Конечная точка API (API Endpoint)
- API-ключ
- ID модели
Базовый URL-адрес обычно можно найти в документации поставщика. Получение API-ключа и ID модели также довольно просто:
- Зарегистрируйте учетную запись у поставщика.
- Прочтите документацию поставщика.
- Создайте API-токен на платформе поставщика.
- Выберите свою модель и получите ID модели.
OpenAI
- Зарегистрируйте учетную запись OpenAI.
- Прочтите документацию OpenAI API.
- Создайте токен на платформе OpenAI.
- Выберите модель, например GPT 5.1 с идентификатором модели
gpt-5.1.
Базовый URL: https://api.openai.com/v1
Anthropic
- Зарегистрируйте учетную запись в консоли Anthropic.
- Прочтите документацию Anthropic API.
- Создайте токен на платформе Anthropic.
- Выберите модель в обзоре моделей, например Claude Sonnet 4.5 с идентификатором модели
claude-sonnet-4-5.
Базовый URL: https://api.anthropic.com/v1
Google
- Зарегистрируйте учетную запись Google. Войдите в Google AI Studio.
- Прочтите документацию Gemini API.
- Создайте токен в Google AI Studio.
- Выберите модель, например Gemini 2.5 Flash с идентификатором модели
gemini-2.5-flash.
Базовый URL: https://generativelanguage.googleapis.com/v1beta/openai
Вы также можете использовать Gemini API в Google Vertex AI.
Google предлагает Gemini 2.5 Flash бесплатно с дневным лимитом 20 запросов в Google AI Studio.
Openrouter
Openrouter — это платформа-агрегатор, позволяющая использовать модели нескольких поставщиков. См. документацию Openrouter.
На платформе часто доступны бесплатные модели, такие как
nvidia/nemotron-nano-12b-v2-vl:free, которые можно использовать без затрат.
Базовый URL: https://openrouter.ai/api/v1
Alibaba
- Зарегистрируйте учетную запись Aliyun на Aliyun
- Прочтите документацию Aliyun API
- Следуйте этому руководству, чтобы создать API-ключ в разделе API Key
- Выберите модель в Model Market. Например, Qwen3 vl plus с ID модели
qwen3-vl-plus
Base URL: https://dashscope.aliyuncs.com/compatible-mode/v1
Для новых зарегистрированных пользователей предоставляется бесплатная квота в 1 млн токенов для каждой модели в течение первых трех месяцев.
Tencent
- Зарегистрируйте учетную запись Tencent Cloud
- Прочтите документацию Tencent API
- Создайте API-ключ в консоли Tencent Cloud
- Выберите модель в Model Square, например, Hunyuan Turbos Vision с ID модели
hunyuan-turbos-vision.
Base URL: https://api.hunyuan.cloud.tencent.com/v1
Для новых зарегистрированных пользователей предоставляется бесплатная квота в 1 млн токенов в сумме для всех моделей.
ByteDance
- Зарегистрируйте учетную запись Volc Engine
- Прочтите документацию Volc Engine API
- Создайте API-ключ в консоли Volc Engine
- Выберите модель в Model Square, например, Doubao 1.6 Vision с ID модели
doubao-seed-1-6-vision-250815.
Base URL: https://ark.cn-beijing.volces.com/api/v3
Для новых зарегистрированных пользователей предоставляется бесплатная квота в 0,5 млн токенов на каждую модель.
О Deepseek
Модели, предоставляемые напрямую Deepseek, не поддерживают визуальный ввод. Модели с открытым исходным кодом, такие как DeepSeek-OCR, поддерживают распознавание математических формул, но требуют самостоятельного хостинга или поиска отдельного поставщика.
Протестируйте ваш API (если необходимо)
Предположим, вы получили API-ключ и ID модели. Вы можете протестировать свой API с помощью такого инструмента, как CherryStudio. Загрузите приложение CherryStudio и используйте настройки вашего API в приложении для тестирования. Попробуйте вставить изображение, чтобы проверить, поддерживает ли модель визуальный ввод.
Если вы не хотите скачивать приложение, вы также можете протестировать свой API, отправив простой запрос. Вот пример запроса для qwen3-vl-plus с использованием curl. Скопируйте и вставьте эту команду в терминал или командную строку:
curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-1234567890" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-vl-plus",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Привет"
}
]
}
]
}'Замените https://dashscope.aliyuncs.com/compatible-mode/v1 на ваш собственный Base URL, оставив часть /chat/completions без изменений. Замените qwen3-vl-plus на ваш ID модели. Замените sk-1234567890 на ваш API-ключ.
Успешный ответ:
{
"choices": [
{
"message": {
"content": "Привет! Чем я могу вам помочь сегодня? 😊",
"reasoning_content": "",
"role": "assistant"
},
}
],
}Настройка во WriteTex
Пожалуйста, следуйте руководству для конкретной платформы, чтобы завершить настройку:
Дополнительно
В этой части авторы предполагают, что читатель понимает, что делает. Хостинг собственной модели выходит за рамки данного руководства. Это не рекомендуется для начинающих или пользователей без опыта в области компьютерных наук.
Самостоятельный хостинг
ollama — это платформа, позволяющая запускать большие языковые модели на вашей собственной машине. Она предоставляет простой API для запуска моделей. Дополнительную информацию см. в документации ollama. В качестве примера: Deepseek-OCR — это модель, которую вы можете использовать для WriteTex.
vLLM — это высокопроизводительный движок инференса для больших языковых моделей. Он поддерживает множество моделей и предоставляет OpenAI-совместимый API. Дополнительную информацию см. в документации vLLM. Рекомендуем попробовать HunyuanOCR и DeepSeek-OCR для быстрого и легкого локального распознавания LaTeX для WriteTex.