Skip to content

사용자 정의 API

BYOK(Bring Your Own Key)라고도 합니다. 이 가이드는 WriteTex를 위한 사용자 정의 AI API 토큰을 얻는 방법에 대한 안내입니다. 이 프로세스에 익숙하다면 이 가이드를 건너뛰어도 좋습니다. 설정에 대한 단계별 가이드는 다음과 같습니다.

면책 조항

WriteTex(당사)는 사용자 정의 API 사용으로 인해 발생하는 모든 비용에 대해 책임을 지지 않습니다. 귀하는 AI API 서비스 제공업체의 서비스 약관 및 해당 관할권의 관련 법률을 준수해야 합니다. 당사는 귀하의 제공업체 모델에서 생성된 결과에 대해 책임을 지지 않습니다. 당사는 이러한 회사들과 제휴 관계가 아닙니다. 자세한 내용은 당사의 이용 약관을 참조하십시오.

용어 정의

  1. OpenAI 호환 API: OpenAI의 API 사양과 호환되는 API입니다. WriteTex는 귀하의 API 엔드포인트가 이 형식일 것으로 예상합니다.
  2. API 엔드포인트/Base URL: API 엔드포인트의 기본 URL입니다. API가 호스팅되는 루트 URL입니다. 예: https://api.openai.com/v1.
  3. API 토큰/키: API 요청을 인증하는 데 사용되는 고유 식별자입니다. 비밀로 유지해야 하며 공개적으로 공유해서는 안 됩니다. 예: sk-1234567890.
  4. 모델 이름/ID: WriteTex에서 사용하려는 모델의 이름 또는 ID입니다. 예: gpt-5.1, qwen/qwen3-vl-8b-instruct. 이는 매우 고유한 매개변수이며 gpt 또는 qwen과 같은 모호한 입력을 허용하지 않습니다.
  5. API 버전: 사용 중인 API의 버전입니다. WriteTex는 Windows, Android 및 MacOS에서 v1 버전을 기대합니다. 만약 Base URL/v1로 끝난다면, Windows, Android 및 MacOS 장치의 baseURL에서 /v1을 제거해야 합니다. Base URL 및 API 버전에 대한 자세한 내용은 플랫폼별 가이드를 참조하십시오.
  6. API 서비스 제공업체: API를 호스팅하는 서비스 제공업체입니다. 일반적으로 OpenAI, Alibaba, Anthropic, Tencent, Google, ByteDance 등과 같은 유명한 기술 대기업들입니다.
  7. 비전 언어 모델 / 멀티모달 모델: 이 모델들은 텍스트와 이미지를 모두 이해할 수 있습니다. 일반적으로 기존 언어 모델보다 강력합니다. 예를 들어, gpt-5.1은 멀티모달 모델입니다.
  8. 토큰(Tokens): 토큰은 모델이 처리하는 텍스트의 기본 단위입니다. 각 요청마다 입력 및 모델의 출력에 따라 일정량의 토큰을 소비합니다. 소비되는 토큰의 양은 요청 비용에 비례합니다. 일반적으로 입력 및 출력 토큰은 다르게 책정됩니다. 예를 들어, gpt-5.1의 가격은 입력 100만 토큰당 $1.25, 출력 100만 토큰당 $10입니다.

제공업체 및 모델 선택

제공업체 및 모델을 선택할 때 다음 요소를 고려하십시오.

  1. 성능: OCR 작업에서 우수한 성능을 보이는 모델을 찾으십시오. 자세한 내용은 LMArena Leaderboard를 참조하십시오.
  2. 비용: 다양한 모델 사용 비용을 비교하십시오. 일부 모델은 다른 모델보다 비쌀 수 있습니다. 비용은 다음과 같이 계산됩니다.

입력 토큰 수 * 입력 가격 + 출력 토큰 수 * 출력 가격

  1. 모델 기능: 모델이 비전 입력을 지원해야 합니다. 즉, 멀티모달 모델이어야 합니다. 예를 들어, gpt-5.1은 멀티모달 모델입니다. 자세한 내용은 제공업체의 웹사이트를 참조하십시오.

모델이 비전 입력을 지원하는지 확인하는 방법

  • 설명에 "vision" 또는 "multi-modal"이 포함된 모델을 찾습니다.
  • 제공업체 웹사이트의 모델 카드를 확인합니다. 일반적으로 모델이 이미지 입력을 지원함을 나타내는 아이콘이 있습니다.

고려할만한 제공업체 및 모델은 다음과 같습니다.

제공업체가성비 모델가격 (입/출)성능 모델가격 (입/출)
OpenAIgpt5 mini$0.25 /$2gpt 5.1$1.25/$10
Anthropicclaude sonnet 4.5$3/$15claude opus 4.5$5/$25
Googlegemini 2.5 flash$0.3/$2.5gemini 3 flash$0.5/$3
Openrouternvidia/nemotron-nano-12b-v2-vl:free0grok 4$3/$15
Alibabaqwen3 vl flash¥0.15/¥1.5qwen3 vl plus¥1/¥10
Tencenthunyuan turbos vision¥3/¥9hunyuan t1 vision¥3/¥9
ByteDancedoubao seed 1.6 flash¥0.15/¥1.5doubao seed 1.6 vision¥0.8/¥8
  • USD $1 ≈ CNY ¥ 7.1
  • 가격은 100만 토큰당 표시됩니다.

WriteTex에서 이루어지는 각 요청에 대해 일반적으로 약 300~1000개의 입력 토큰과 10~100개의 출력 토큰을 소비합니다.

대부분의 모델 제공업체는 넉넉한 무료 등급을 제공합니다. 일반적으로 무료 계정에 가입하고 비용 없이 모델을 사용하기 시작할 수 있습니다.

API 설정 얻기

API 설정을 위해서는 다음 세 가지 구성 요소가 필요합니다.

  • API 엔드포인트
  • API 키
  • 모델 ID

기본 URL은 일반적으로 제공업체의 문서에서 찾을 수 있습니다. API 키 및 모델 ID를 얻는 것도 매우 간단합니다.

  1. 제공업체에서 계정을 등록합니다.
  2. 제공업체의 문서를 읽습니다.
  3. 제공업체의 플랫폼에서 API 토큰을 생성합니다.
  4. 모델을 선택하고 모델 ID를 얻습니다.

OpenAI

  1. OpenAI 계정을 등록합니다.
  2. OpenAI API 문서를 읽습니다.
  3. OpenAI 플랫폼에서 토큰을 생성합니다.
  4. 모델을 선택합니다. 예를 들어 모델 ID가 gpt-5.1인 GPT 5.1입니다.

Base URL: https://api.openai.com/v1

Anthropic

  1. Anthropic 콘솔 계정을 등록합니다.
  2. Anthropic API 문서를 읽습니다.
  3. Anthropic 플랫폼에서 토큰을 생성합니다.
  4. 모델 개요에서 모델을 선택합니다. 예를 들어 모델 ID가 claude-sonnet-4-5인 Claude Sonnet 4.5입니다.

Base URL: https://api.anthropic.com/v1

Google

  1. Google 계정을 등록합니다. Google AI Studio에 로그인합니다.
  2. Gemini API 문서를 읽습니다.
  3. Google AI Studio에서 토큰을 생성합니다.
  4. 모델을 선택합니다. 예를 들어 모델 ID가 gemini-2.5-flashGemini 2.5 Flash입니다.

Base URL: https://generativelanguage.googleapis.com/v1beta/openai

Google Vertex AI에서도 Gemini API를 사용할 수 있습니다.

Google은 Google AI Studio에서 하루 20개 요청 제한으로 Gemini 2.5 Flash를 무료로 제공합니다.

Openrouter

Openrouter는 다양한 제공업체의 여러 모델을 사용할 수 있게 해주는 모델 라우터입니다. 자세한 내용은 Openrouter 문서를 참조하십시오.

Openrouter에는 종종 무료 모델이 있습니다. 예를 들어 nvidia/nemotron-nano-12b-v2-vl:free는 비용 없이 사용할 수 있는 무료 모델입니다. Base URL: https://openrouter.ai/api/v1

Alibaba

  1. Aliyun에서 Aliyun 계정을 등록합니다.
  2. Aliyun API 문서를 읽습니다.
  3. 이 가이드에 따라 API Key에서 API 키를 생성합니다.
  4. 모델 마켓에서 모델을 선택합니다. 예를 들어 모델 ID가 qwen3-vl-plusQwen3 vl plus입니다.

Base URL: https://dashscope.aliyuncs.com/compatible-mode/v1

신규 등록 사용자는 처음 3개월 동안 각 모델에 대해 100만 토큰의 무료 할당량을 받습니다.

Tencent

  1. Tencent Cloud 계정을 등록합니다.
  2. Tencent API 문서를 읽습니다.
  3. Tencent Cloud 콘솔에서 API 키를 생성합니다.
  4. 모델 스퀘어에서 모델을 선택합니다. 예를 들어 모델 ID가 hunyuan-turbos-visionHunyuan Turbos Vision입니다.

Base URL: https://api.hunyuan.cloud.tencent.com/v1

신규 등록 사용자는 모든 모델에 대해 총 100만 토큰의 무료 할당량을 받습니다.

ByteDance

  1. Volc Engine 계정을 등록합니다.
  2. Volc Engine API 문서를 읽습니다.
  3. Volc Engine 콘솔에서 API 키를 생성합니다.
  4. 모델 스퀘어에서 모델을 선택합니다. 예를 들어 모델 ID가 doubao-seed-1-6-vision-250815Doubao 1.6 Vision입니다.

Base URL: https://ark.cn-beijing.volces.com/api/v3

신규 등록 사용자는 모델당 50만 토큰의 무료 할당량을 받습니다.

Deepseek에 대하여

Deepseek에서 직접 제공하는 모델은 비전 입력을 지원하지 않습니다. DeepSeek-OCR과 같은 오픈 소스 모델은 수학 방정식 인식을 지원하지만 셀프 호스팅이나 별도의 제공업체를 찾아야 합니다.

API 테스트 (필요한 경우)

이제 API 키와 모델 ID를 얻었다고 가정합니다. CherryStudio와 같은 도구를 사용하여 API를 테스트할 수 있습니다. Cherry Studio 앱을 다운로드하고 앱에서 API 설정을 사용하여 API를 테스트하십시오. 이미지를 삽입하여 모델이 비전 입력을 지원하는지 확인하십시오.

앱을 다운로드하고 싶지 않다면 간단한 요청을 보내 API를 테스트할 수도 있습니다. 다음은 curl을 사용한 qwen3-vl-plus의 요청 예시입니다. 이 명령을 복사하여 터미널 또는 CMD에 붙여넣으십시오.

bash
curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
  -H "Authorization: Bearer sk-1234567890" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-vl-plus",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": "안녕하세요"
          }
        ]
      }
    ]
  }'

https://dashscope.aliyuncs.com/compatible-mode/v1을 자신의 Base URL로 바꾸고, /chat/completions 부분은 그대로 유지하십시오. qwen3-vl-plus를 자신의 모델 ID로 바꾸십시오. sk-1234567890을 자신의 API 키로 바꾸십시오.

성공적인 응답:

json
{
    "choices": [
        {
            "message": {
                "content": "안녕하세요! 오늘 무엇을 도와드릴까요?😊",
                "reasoning_content": "",
                "role": "assistant"
            },
        }
    ],
}

WriteTex에서 설정 구성

고급 설정

이 부분에서는 독자가 자신이 무엇을 하고 있는지 알고 있다고 가정합니다. 사용자 정의 모델 호스팅은 이 가이드의 범위를 벗어납니다. 초보자나 컴퓨터 과학 배경이 없는 사용자에게는 권장되지 않습니다.

셀프 호스팅

ollama는 자신의 컴퓨터에서 대규모 언어 모델을 실행할 수 있게 해주는 플랫폼입니다. 모델을 실행하는 데 사용할 수 있는 간단한 API를 제공합니다. 자세한 내용은 ollama 문서를 참조하십시오. 예를 들어 Deepseek-OCR은 WriteTex에서 사용할 수 있는 모델입니다.

vLLM은 대규모 언어 모델을 위한 고성능 추론 엔진입니다. 다양한 모델을 지원하며 OpenAI 호환 API를 제공합니다. 자세한 내용은 vLLM 문서를 참조하십시오. WriteTex를 위한 빠르고 가벼운 로컬 LaTeX OCR로 HunyuanOCRDeepSeek-OCR을 사용해 볼 것을 권장합니다.