メインコンテンツまでスキップ

Ollama からの移行ガイド

Ollama から Lykuro AI への移行は base_urlapi_keymodel の変更だけで完了します。

Python

# Before (Ollama)
from openai import OpenAI
client = OpenAI(base_url="http://localhost:11434/v1", api_key="ollama")

# After (Lykuro AI) — base_url / api_key / model を変えるだけ
from openai import OpenAI
client = OpenAI(
base_url="https://api.lykuro.ai/deepseek/v1",
api_key="sk-jp-YOUR_KEY",
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[{"role": "user", "content": "こんにちは!"}],
)

モデル名の対応表

Ollama モデルLykuro AI(base_url / model)特徴
llama3.1:8b/deepseek/v1deepseek-chat高速・コスパ重視
llama3.1:70b/deepseek/v1deepseek-chat同等の出力品質
qwen2.5:7b/alibaba/compatible-mode/v1qwen-plusAlibaba 製
mistral/deepseek/v1deepseek-chat汎用タスク

メリット

Ollama (ローカル)Lykuro AI
初期コストGPU 購入費が必要不要
スケールシングルマシン上限自動スケール
最新モデル手動更新が必要常に最新
本番利用可用性・監視が課題マネージド

注意点

  • プロンプト本文は保存されません (Zero-Retention)。Ollama と同様にプライバシー保護されます
  • ローカル実行と異なりネットワーク遅延が発生しますが、高速な中国LLMにより実測 TTFT は 200ms 以下が多数