メインコンテンツまでスキップ

ストリーミング

stream: true を指定すると、レスポンスを Server-Sent Events(SSE)で逐次受信できます。 Lykuro はレスポンスを生バイトで透過するため、上流(OpenAI互換)と完全に同じ形式です。

import os
from openai import OpenAI

client = OpenAI(
api_key=os.environ["LYKURO_API_KEY"],
base_url="https://api.lykuro.ai/deepseek/v1",
)

stream = client.chat.completions.create(
model="deepseek-chat",
messages=[{"role": "user", "content": "俳句を3つ作ってください。"}],
stream=True,
)

for chunk in stream:
delta = chunk.choices[0].delta.content
if delta:
print(delta, end="", flush=True)
print()

:::note 課金とストリーミング ストリーミングでも、レスポンス末尾の usage を Lykuro が覗き見て課金します。 プロンプト本文は保存されません(Zero-Retention)。 :::