Claude Haiku 4.5 vs GPT-4.1 — Tarification comparative
Tarifs API et détails du tokeniseur côte à côte pour Claude Haiku 4.5 (Anthropic) et GPT-4.1 (OpenAI).
Tarification comparative
| Caractéristique | Claude Haiku 4.5 | GPT-4.1 |
|---|---|---|
| Fournisseur | Anthropic | OpenAI |
| Entrée (par 1M tokens) | $0.800 | $2.00 |
| Sortie (par 1M tokens) | $4.00 | $8.00 |
| Mise en cache du contexte | Oui — 90% de réduction sur les tokens mis en cache | Non |
| Remise API par lot | Non disponible | 50% de réduction |
| Fenêtre de contexte | 200K tokens | 1M tokens |
| Tokeniseur | Anthropic tokenizer | o200k_base (tiktoken) |
Exemple concret
1 000 requêtes API par mois, chacune avec 500 tokens d'entrée et 200 tokens de sortie (500K d'entrée + 200K de sortie au total).
Claude Haiku 4.5
$1.2000
Entrée : $0.4000 +Sortie : $0.8000
GPT-4.1
$2.6000
Entrée : $1.0000 +Sortie : $1.6000
Claude Haiku 4.5 est 54% moins cher pour cette charge de travail — économisant $1.4000 par mois à ce volume.
Questions fréquentes
- Claude Haiku 4.5 est-il moins cher que GPT-4.1 ?
- Oui, Claude Haiku 4.5 est moins cher pour la charge de travail typique ci-dessus. À $0.800/1M en entrée et $4.00/1M en tokens de sortie, il coûte $1.2000 contre $2.6000 pour GPT-4.1 — une différence de 54%. Les coûts évoluent de façon linéaire, donc des charges de travail plus importantes amplifient cet écart.
- Quelle est la fenêtre de contexte de Claude Haiku 4.5 vs GPT-4.1 ?
- Claude Haiku 4.5 prend en charge une fenêtre de contexte de 200K tokens. GPT-4.1 prend en charge une fenêtre de contexte de 1M tokens. Une fenêtre de contexte plus grande vous permet d'inclure plus de texte — documents, historique de conversation ou code — dans un seul appel API.
- Claude Haiku 4.5 ou GPT-4.1 prennent-ils en charge la mise en cache du contexte ou les remises par lot ?
- Claude Haiku 4.5 supports context caching (90% off repeated tokens). It does not offer a batch API discount. GPT-4.1 does not support context caching. It offers a 50% Batch API discount.
Calculez les coûts pour votre prompt réel
Collez votre prompt dans le calculateur et obtenez des comptes de tokens exacts en utilisant le vrai tokeniseur de chaque modèle — tout dans votre navigateur.
Ouvrir le calculateur