Claude Sonnet 4.6 vs GPT-4.1 — Tarification comparative
Tarifs API et détails du tokeniseur côte à côte pour Claude Sonnet 4.6 (Anthropic) et GPT-4.1 (OpenAI).
Tarification comparative
| Caractéristique | Claude Sonnet 4.6 | GPT-4.1 |
|---|---|---|
| Fournisseur | Anthropic | OpenAI |
| Entrée (par 1M tokens) | $3.00 | $2.00 |
| Sortie (par 1M tokens) | $15.00 | $8.00 |
| Mise en cache du contexte | Oui — 90% de réduction sur les tokens mis en cache | Non |
| Remise API par lot | Non disponible | 50% de réduction |
| Fenêtre de contexte | 200K tokens | 1M tokens |
| Tokeniseur | Anthropic tokenizer | o200k_base (tiktoken) |
Exemple concret
1 000 requêtes API par mois, chacune avec 500 tokens d'entrée et 200 tokens de sortie (500K d'entrée + 200K de sortie au total).
Claude Sonnet 4.6
$4.5000
Entrée : $1.5000 +Sortie : $3.0000
GPT-4.1
$2.6000
Entrée : $1.0000 +Sortie : $1.6000
GPT-4.1 est 42% moins cher pour cette charge de travail — économisant $1.9000 par mois à ce volume.
Questions fréquentes
- Claude Sonnet 4.6 est-il moins cher que GPT-4.1 ?
- Non, GPT-4.1 est moins cher pour la charge de travail typique ci-dessus. À $2.00/1M en entrée et $8.00/1M en tokens de sortie, il coûte $2.6000 contre $4.5000 pour Claude Sonnet 4.6 — une différence de 42%.
- Quelle est la fenêtre de contexte de Claude Sonnet 4.6 vs GPT-4.1 ?
- Claude Sonnet 4.6 prend en charge une fenêtre de contexte de 200K tokens. GPT-4.1 prend en charge une fenêtre de contexte de 1M tokens. Une fenêtre de contexte plus grande vous permet d'inclure plus de texte — documents, historique de conversation ou code — dans un seul appel API.
- Claude Sonnet 4.6 ou GPT-4.1 prennent-ils en charge la mise en cache du contexte ou les remises par lot ?
- Claude Sonnet 4.6 supports context caching (90% off repeated tokens). It does not offer a batch API discount. GPT-4.1 does not support context caching. It offers a 50% Batch API discount.
Calculez les coûts pour votre prompt réel
Collez votre prompt dans le calculateur et obtenez des comptes de tokens exacts en utilisant le vrai tokeniseur de chaque modèle — tout dans votre navigateur.
Ouvrir le calculateur