ai·En proceso·2026

SSD Editorial

La editorial ya tenía los datos. Solo necesitaba escucharlos.

La Idea

Todo empezó como una tesis. 1,280 registros de ventas de una editorial familiar limeña. Libros de ficción infantil y juvenil. Fechas, títulos, canales, ferias. Cuatro años de decisiones acumuladas en un Excel que nadie había interrogado en serio. La pregunta original era técnica: ¿puede un modelo de machine learning predecir cuántos libros va a vender un título el próximo trimestre? Pero mientras avanzaba apareció una pregunta más interesante. ¿Qué pasa cuando una editorial pequeña deja de adivinar y empieza a saber?

El Porqué

Las editoriales familiares toman decisiones de la misma forma desde hace décadas. ¿Cuántos ejemplares imprimir? Intuición. ¿Vale la pena ir a esa feria en Arequipa? Intuición. ¿Qué autor vende más en temporada escolar? Intuición con algo de memoria. No porque sean malas en su trabajo. Sino porque nadie les había construido una herramienta que hablara su idioma. Cuando empecé a estudiar los datos me encontré con algo que no esperaba. No era solo un problema de predicción. Era un problema de visibilidad. La editorial no sabía qué títulos financiaban a cuáles. No sabía qué ferias realmente rentaban después de descontar el stand, el personal y el transporte. No sabía si el estilo de ilustración influía en las ventas por rango de edad. Tenía los datos. No tenía el espejo. SSD Editorial nace de esa observación: construir el espejo. Un sistema que tome los datos históricos, los procese con tres algoritmos de ML —XGBoost, Random Forest y LSTM— y devuelva algo accionable. No un paper. No un dashboard académico. Una herramienta que la editorial pueda usar el lunes por la mañana.

Bitácora

4 entradas

21 jun 202610:00

Idea

Hipótesis

Empezó como una tesis de pregrado. Tres algoritmos, 1,280 registros, una metodología CRISP-DM y un jurado esperando resultados. Pero en algún punto entre los datos y el modelo apareció una pregunta que no cabía en ningún capítulo: ¿y si esto fuera una herramienta real?

21 jun 202614:00

Diseño de sistema

Decisión

Definí el stack. Python 3.11, XGBoost, Random Forest, LSTM, Streamlit, SQLite, Plotly. uv como gestor de paquetes. Claude Code como entorno de desarrollo. La decisión más importante no fue técnica: fue separar la tesis del sistema. Los resultados académicos están cerrados. Lo que construyo ahora es otra cosa.

21 jun 202616:00

Datos

Decisión

Elegí SQLite sobre NoSQL. Los datos son relacionales por naturaleza: un título tiene un autor, un ilustrador y muchas ventas. Un canal puede ser una librería, una plataforma online o una feria en otro distrito. SQL hace esas preguntas de forma natural. NoSQL me hubiera obligado a escribir a mano lo que ya existe.

21 jun 202620:00

Producto

Avance

El sistema creció más de lo esperado. Lo que empezó como un dashboard de predicciones terminó incluyendo un calendario de ferias con alertas de stock, un módulo de ROI por evento y análisis geográfico de ventas fuera de Lima. La estructura está preparada para una fase 2: análisis automático de estilo de escritura e ilustración con NLP y Computer Vision. Primero, que funcione. Después, que aprenda.

Estado actual

En proceso