Volver al Glosario

Inferencia

La inferencia es el proceso de usar un modelo de IA entrenado para hacer predicciones o generar respuestas sobre datos nuevos y previamente no vistos en tiempo real.

En Detalle

Mientras que el entrenamiento crea el modelo de IA, la inferencia es donde realmente hace trabajo útil. Cada vez que un agente IA lee un mensaje de cliente y genera una respuesta, eso es inferencia. El rendimiento de inferencia se mide por latencia, throughput y precisión.

En soporte al cliente, la velocidad de inferencia impacta directamente la experiencia — las respuestas necesitan sentirse casi instantáneas en chat en vivo, incluso si el modelo subyacente procesa cadenas de razonamiento complejas. Optimizar la inferencia implica técnicas como cuantización del modelo, caché, procesamiento por lotes y despliegue en el borde. La gestión de costes también es crítica, ya que los costes de inferencia escalan con el volumen de uso.

Woman with laptop

Elimina la atención al cliente tal
como la conoces.

Empieza gratis