Saltar para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs.apimart.ai/llms.txt

Use this file to discover all available pages before exploring further.

Q9: como otimizar os custos de chamadas de API?

Sugestões para otimização de custos:
  • Escolha modelos adequados às suas necessidades (modelos diferentes têm preços diferentes)
  • Use respostas em streaming para reduzir o tempo de espera
  • Defina limites razoáveis de tokens
  • Faça cache de respostas comuns
  • Monitore o uso para evitar consumo inesperado
Dicas práticas
  1. Escolha o modelo certo: para tarefas simples, modelos de menor custo podem alcançar bons resultados
  2. Defina max_tokens: limitar o tamanho da resposta pode controlar os custos de forma eficaz
  3. Implemente uma estratégia de cache: armazenar em cache os resultados de requisições repetidas ou semelhantes pode reduzir significativamente o número de chamadas
  4. Use respostas em streaming: melhora a experiência do usuário e permite detectar problemas precocemente, interrompendo requisições desnecessárias

Ver preços dos modelos

Saiba mais sobre os preços detalhados de cada modelo