Por qué tu LLM trunca antes de llegar a max_tokens

Los LLMs no esperan a chocar con max_tokens: si sospechan que se van a pasar, truncan antes. Cómo lo descubrimos en DocuTray procesando documentos densos.

Bloques de texto apilados con una línea punteada que marca el límite max_tokens de un LLM
// 25 may. 2026
Lo último

Guías técnicas y notas de ingeniería