23/2/09

Dar de comer al ordenador

No me refiero a la energía necesaria e indispensable para que el ordenador 'ande', si no a la alimentación de las bases de datos.

Posiblemente el proceso más tedioso del trabajo de muchas personas es extraer datos de unas fuentes para luego cargarlos en las bases de datos indispensables para muchísimas empresas. Sin bases de datos olvídate de muchos análisis, pero, que sepas que las bases de datos no se mantienen solas, "¡sorpresa! te vendo una solución basada en una base de datos (valga la rebuznancia), pero luego tú vas a tener que alimentarla."

Algo que parece obvio, si quieres analizar datos antiguos es muy fácil porque ya los tendrás, pero si los quieres nuevos, alguien tiene que perder parte de su tiempo cargándolos.

Vale, vale, esto parece tan sumamente claro y meridiano que es estúpido, pero no lo es tanto. Cuando trabajas en un proyecto que trata de obtener algo de una base de datos que tira de varias fuentes, con varios responsables, el resultado es que necesitas a una persona que al menos una vez cada X tiempo se tendrá que conectar, descargar los datos, importarlos en la Base de Datos y luego, tranquilamente darle al botón de analizar (suponiendo que los análisis no sean manuales). De forma que lo que se crea como un proyecto con un 'coste puntual', se convierte en un 'coste fijo' ( en el sentido de que hay que mantener un coste en tiempo a lo largo del tiempo), se convierte casi en estructural.

Esta idea me surge ahora que estoy trabajando en un proyecto, en el que cada semana necesito una serie de datos para generar una BBDD y una serie de informes, pero no tenemos todos los accesos, dependemos de que nos envíen parte de la información, si los informes están incompletos, puede ser por la propia falta del destinatario aunque la culpa final será del que genera el informe por no reclamarla.

"Lo malo de los proyectos de Bases de Datos es que la alimentación es manual, una buena automatización y estandarización de procesos puede permitirnos trabajar más rápido y obtener mejores resultados."

2 comentarios:

  1. En parte tienes razón, pero significa que se ha hecho una gestión/implementación errónea del sistema. Ya que los datos provienen de distintas fuentes, lo suyo sería que ubiese comunicación entre ellas, o una forma de importación común a partir de un XML o un protocolo/lenguage común.

    Si non se hace esto, ocurre lo que has decrito.

    Si se partiese desde un sistema desde cero, se debería tener en cuenta que al insertar los nuevos datos se insrtarán tb en la herramienta de analisis.

    ResponderEliminar
  2. De acuerdo, pero como se trata de un proyecto ad-hoc, no es tan fácil, aunque estamos de acuerdo en que debería ser automático, esa base de datos únca que planeas también tendría que ser alimentada. Los procesos automáticos de carga de datos desde el origen son muy bonitos pero solo si no fallan, la alimentación y la limpieza de bases de datos es un trabajo curioso e indispensable.

    ResponderEliminar