Autor

Matías Sánchez Cabrera

Fundador y CEO de DocuTray, fundador de Datalized y primer Data Scientist de Cornershop. Ingeniero U. de Chile; escribe sobre procesamiento de documentos.

Frutillar, Chile Sitio web @@MatiasSanchez Facebook 13 artículos

Tarjeta de presentación del DocuTray CLI con el comando de instalación: npm install -g @docutray/cli

Document Processing

Extracción de datos de PDFs desde el terminal: El CLI de DocuTray

Hoy lanzamos el CLI de DocuTray. Está pensado para que tu coding agent agregue capacidades de procesar documentos y extraer datos de PDF en tu aplicación, dándole la

Matías Sánchez Cabrera15 jun.4 min

Bloques de texto apilados con una línea punteada que marca el límite max_tokens de un LLM

Document Processing

Por qué tu LLM trunca antes de llegar a max_tokens

Los LLMs no esperan a chocar con max_tokens: si sospechan que se van a pasar, truncan antes. Cómo lo descubrimos en DocuTray procesando documentos densos.

Matías Sánchez Cabrera25 may.5 min

Busto clásico junto a un PDF de factura y banderas de países de LATAM, sobre extracción de datos COMEX

Document Processing

Cómo extraer datos de facturas PDF para COMEX en LATAM

Extraer datos de facturas PDF para COMEX en LATAM no es como procesar una factura local: cambian formatos, monedas, identificadores fiscales y los line items vienen por cientos. Cómo resolverlo con un schema único y un par de líneas de código.

Matías Sánchez Cabrera01 may.7 min

Busto clásico rodeado de documentos, ilustrando la brecha entre un LLM en demo y la producción

Document Processing

Extraer datos de documentos con IA: el gap de producción

El demo siempre funciona. Pegas un PDF en el chat, pides los campos estructurados, y el modelo responde con un JSON perfecto. "¿Por qué no hacemos esto

Matías Sánchez Cabrera14 abr.4 min

Comparación JSON vs TOON: un busto rodeado de llaves y corchetes frente a otro sobre una estructura tabular

Document Processing

JSON vs TOON: reducir tokens de salida al extraer datos

Cuando procesamos facturas internacionales con cientos de líneas de producto, el JSON de respuesta superaba los max tokens del modelo. Probamos TOON — un formato que promete ~40% menos tokens de salida. Esto es lo que aprendimos.

Matías Sánchez Cabrera26 mar.5 min

Busto clásico con monedas y gráficos financieros, ilustrando el procesamiento de cartolas de inversión

Industría

Cartolas de inversión en Multifamily office: el problema de consolidar todo

Una familia puede tener cuentas en Santander Chile, Morgan Stanley en Miami y Julius Bär en Suiza. Cada banco entrega una cartola distinta. Así se resuelve el procesamiento de documentos en el sector financiero sin morir en Excel.

Matías Sánchez Cabrera20 mar.4 min

Dos bustos con circuitos etiquetados Extend y DocuTray, con un diagrama de nodos entre ambos

Document Processing

DocuTray vs Extend AI: pipeline listo vs plataforma flexible

Extend y DocuTray procesan documentos con IA, pero con filosofías de diseño distintas. Extend te da las primitivas para armar tu propio pipeline. DocuTray te da el pipeline ya construido.

Matías Sánchez Cabrera19 mar.4 min

Dos bustos del David con un fragmento de JSON al centro, comparando DocuTray y Reducto

Document Processing

DocuTray vs Reducto: extracción vs pipeline completo

Reducto y DocuTray extraen datos de documentos, pero resuelven problemas distintos en el pipeline. Reducto es una primitiva de extracción excelente. DocuTray va más lejos: identifica, extrae, valida y enriquece en el mismo API call.

Matías Sánchez Cabrera19 mar.4 min

Diagrama de un workflow de n8n con DocuTray para procesar gastos reembolsables y volcarlos en una planilla

Guías

Procesa Gastos Reembolsables con DocuTray y n8n

Automatiza el procesamiento de gastos reembolsables de tu equipo con n8n y DocuTray. Recorre las carpetas de cada colaborador en Google Drive, extrae los datos de boletas y facturas, y los consolida en Google Sheets. Incluye template descargable.

Matías Sánchez Cabrera18 mar.3 min

Rostro clásico dividido en una mitad técnica y otra escultórica, comparando DocuTray y Amazon Textract

Document Processing

DocuTray vs Amazon Textract: Principales diferencias

Cuando un developer necesita extraer datos de documentos, lo primero que aparece en Google es Amazon Textract. Es el default. Está en AWS, tiene buena documentación, y si

Matías Sánchez Cabrera16 mar.5 min

Diagrama de un workflow de n8n con DocuTray que procesa cartolas de tarjeta de crédito desde Google Drive

Guías

Procesa Cartolas de Tarjeta de Crédito en Google Drive con n8n y DocuTray

Automatiza el procesamiento de cartolas de tarjeta de crédito usando n8n y DocuTray. Lee los PDFs desde Google Drive, extrae los datos y los deja ordenados en Google Sheets. Incluye template descargable.

Matías Sánchez Cabrera11 mar.3 min

Las cinco etapas de DocuTray: identificación, extracción, validación, enriquecimiento y exportación

Document Processing

Más allá del OCR

La inteligencia artificial le ha dado nueva vida a la industria de OCR y Procesamiento Inteligente de Documentos. Nuevos actores en un mercado ya saturado lanzan servicios que

Matías Sánchez Cabrera10 mar.2 min