Historiadores y Bases de Datos 1. François-Xavier Guerra

Nótese que esta entrada replica la publicada en este sitio.

Cuando estudié la licenciatura, allá por la década de 1980, me comenzó a interesar el uso de las computadoras y las posibilidades de aplicar la tecnología a la investigación histórica. En esos años era muy difícil acercarse a una Computadora Personal (PC), aprender a utilizarla y sacarle algún provecho. La primera máquina que recuerdo haber tecleado y que no dejaba de sorprenderme con lo que aparecía en la pantalla negra con caracteres verdes fue una Apple IIe que tenían en un laboratorio de arqueología de La Escuela y en la que ya se podía correr el dBase II, así que tuve la oportunidad de aprender algo sobre bases de datos (BD) y procesadores de textos (el transparente WordPerfect para el Apple DOS). Ahí fue cuando empezó mi curiosidad por las BD; primero el problema de cómo funcionaban y segundo el problema de cómo diseñar una BD para los fines de una investigación. Y en ese sentido, siempre es bueno detenerse a pensar cómo hicieron las cosas algunos historiadores que utilizaron recursos informáticos para su investigación.

Análisis de un diseño.

En 1988 apareció la traducción al español, en dos tomos, del importante libro de François-Xavier Guerra, Del antiguo régimen a la revolución, cuya investigación inició en 1971 y fue presentada como tesis de doctorado de estado en Francia en 1982, luego publicada como libro en 1985.(1) A mi no me interesaba en realidad una historia tan contemporánea, pero el trabajo de Guerra me llamó la atención por su propuesta metodológica. FX Guerra se propuso reconstruir y analizar el universo de los actores políticos del porfiriato y la revolución para encontrar las dinámicas de cambios y permanencias en el sistema. Para hacer el análisis, Guerra recurrió a una prosopografía colectiva para lo cual tuvo que armarse de una BD ad hoc que le permitiera la captura y el manejo de información biográfica de varios miles de personajes. Todo ello, obviamente, lo hizo con los recursos informáticos existentes en el momento en el que llevó a cabo su investigación: la década de 1970.

La base de datos prosopográfica que diseñó Guerra para estudiar a los actores políticos de la historia mexicana entre 1876 y 1930, reúne información de alrededor de 7,838 individuos y colectividades, y cuenta con cerca de cien mil datos diferentes relacionados a ellos: origen familiar, fecha y lugar de nacimiento, educación, carrera política o militar y riqueza. En suma, se trata de un total de cuarenta y dos variables asociadas a cada personaje que dan cuenta de su vida y actividad publica de manera sistemática. En la actualidad, cualquiera que tenga una PC podría tratar esta información con un programa de BD relacional de fácil manejo, como Microsoft Access o FileMaker. Pero en la década de 1970, las cosas era muy distintas.

Afortunadamente, FX Guerra incluyó la base de datos en los anexos I y II de su libro, así que se puede reconstruir la manera en la que fue diseñada. Sabemos por él también que tuvo que recurrir al Centro de Cálculo (CIRCE) en Orsay. Pero fuera de comentar que la base de datos tuvo que ser alojada en tres grandes cintas magnéticas, no nos da mayor detalle de la máquina o del programa que fue utilizado, y refiere solamente que éste fue diseñado por Denys Ducornet, seguramente un ingeniero en sistemas. Sin embargo, navegando por Internet me topé con que, por aquel tiempo, en el CIRCE de Orsay tenían máquinas de la familia IBM System 360. Así que la máquina en la que se desarrolló la BD de FX Guerra debió tener un aspecto parecido a la que se ve en la fotografía de abajo.

Supercomputer_NSA-IBM360_85-1024x830

IBM System 360 Modelo 85 Tomada de Wikipedia

La familia de las IBM System 360 corresponde a un tipo de máquina que se conoce como Computadora Central o Mainframe. Las IBM S-360 fueron producidas entre 1964 y 1977,  eran inmensas y funcionaban con sistemas operativos cuya utilización demanda necesariamente el conocimiento de lenguaje ensamblador de alto nivel para poder darle instrucciones a la máquina. Algunas tenian pantallas en las que se podían leer las líneas de comandos y guardaban los datos en grandes cintas magnéticas. La base de datos de Guerra estuvo contenida en tres de estas cintas. Es importante resaltar que, al contrario de nuestras actuales PC de escritorio, en ese tipo de máquinas es necesario codificar previamente toda la información que se introduce en la base de datos. El que FX Guerra haya considerado necesario incluir en los anexos del libro la explicación de cómo se codificó la información es de gran ayuda para los historiadores interesados en la prosopografía porque, aunque no utilicemos una IBM S-360 sino una pequeña PC con un programa de BD, nos muestra que es muy importante la manera en la que se eligen los datos a sistematizar y nos permite entender cómo diseñar una BD.

Cuando tuve en mis manos el libro de FX Guerra estuve repasando durante varios meses los anexos relativos a la base de datos. Para finales de la década de 1980, toda la explicación de la codificación podía parecer un tanto árida pues ya contábamos con PC con programas en los que se podían diseñar BD sin recurrir a una codificación previa tan compacta. Sin embargo, observar el sistema de codificación resultaba interesante e incluso útil porque, por entonces, los campos de las BD no soportaban textos largos tipo memo sino que tenían que construirse campos con solamente algunos cuantos caracteres alfanuméricos. Además, el ejercicio permitía que uno se adentrase en la lógica del diseño.

Aunque parece lo contrario a simple vista, la codificación es muy sencilla y obedece a las necesidades de interrelacionar partículas de información con una persona determinada, ya sea individuo o colectividad. Lo primero que tuvieron que hacer fue determinar una clasificación para los individuos, pues la finalidad de una base de datos prosopográfica es relacionar y organizar la información biográfica de los personajes. Para ello se optó por dotar a los individuos con un código de identificación único que consta de las iniciales de su primer apellido y su primer nombre, más un número arbitrario de uno a cuatro dígitos (al parecer, es el número consecutivo según se fue alimentando la BD). Por ejemplo, Francisco I. Madero está codificado como MF 7081, mientras que Porfirio Díaz tiene el código DP 7080. En el caso de las colectividades (ciudades, pueblos, unidades militares), el proceso de identificación es muy parecido.

Una vez organizada y sistematizada la lista de los actores individuales y colectivos, fue necesario establecer la codificación para el resto de la información. Como se trata de un análisis prosopográfico, los datos básicos hacen referencia a la vida de una persona: familia, nacimiento, educación, actividad pública y muerte. También son importantes los datos cronológicos y espaciales pues los individuos hacen su vida en el espacio-tiempo. Pero, como el interés principal era analizar la participación política, hay una serie de datos importantes que Guerra decidió tomar en cuenta: sus cargos políticos o militares, su actividad en acciones importantes, sus vínculos personales y su filiación política.

Cada uno de los acontecimiento de la biografía de un actor se codificó mediante la creación de un módulo de diez celdas en las que debía describirse el suceso de la manera más sintética posible. Cada módulo debía organizar la información sobre la naturaleza del acontecimiento, fechas, lugares, así como la característica específica de ese dato. Después, cada una de las celdas se llenó con un carácter alfanumérico preestablecido y así se obtenía el código respectivo del acontecimiento particular.

Los datos biográficos de un individuo adquieren una sintaxis curiosa en el informe impreso de la BD. Por ejemplo, para referirse al nacimiento de una persona el módulo comienza con el código BN (posiblemente “biographie” y “naissance“) en las dos primeras celdas; las dos siguientes se refieren al año de nacimiento, la siguiente al mes, y las cinco restantes al lugar. De tal manera, los datos del nacimiento de Francisco I. Madero se expresan con la siguiente sintaxis:

BN73ACO036

Lo cual quiere decir que Francisco I Madero nació en algún día del mes de octubre de 1873, en la Hacienda de Parras, Coahuila.

Veamos, por ejemplo, la ficha biográfica completa de Bernardo Reyes en la base de datos de FX Guerra:

BREYES0

Biografía codificada del Gral. Bernardo Reyes en la BD de F-X Guerra

Los códigos leídos por filas de izquierda a derecha y de arriba a abajo indican lo siguiente: 1) Es parte de una red de lazos interpersonales (LX), 2) Origen familiar (BF), 3) Fecha y lugar de nacimiento (BN), 4) Cultura (BC), 5) Profesión (BW, 6) Grado militar (WF), 7) Victoria militar (BZ), y así hasta llegar a BM que se refiere a la fecha y lugar de fallecimiento que, en el caso de Reyes se lee: “caído en combate en el mes de febrero de 1913 en la ciudad de México.”

Por fortuna, las BD en la actualidad nos permiten generar campos con texto completo y no es necesario sintetizar la información como se hacía anteriormente, aunque estos campos presentan el problema de no poder ser indexados por lo que tenemos que elegir cuáles campos de nuestra BD podrán contener texto completo y cuales necesariamente deberán ir ser numéricos o alfanuméricos con un número de caracteres limitado para que la BD tenga un mejor rendimiento. Pero ese será el tema de otra entrada.

Lo que sigue siendo muy interesante de la BD de FX Guerra es el cómo se determinaron las variables que entran en juego en la biografía de una persona así como su clasificación. Mientras que un grupo del total de las 46 variables se refiere a acciones específicas de la vida (nacimiento, educación, origen, muerte), otras se refieren a los cargos políticos, administrativos y militares ocupados por la persona. Es decir, una base de datos prosopográfica de este tipo está diseñada haciendo énfasis en las personas como actores políticos. Si nosotros queremos diseñar una base de datos prosopográfica, no solamente tendremos que incluir los datos vitales de las personas sino todos aquellos acontecimientos que sean importantes dependiendo de la orientación de nuestra investigación. Así, serán diferentes los acontecimientos incluidos en una BD construida para una investigación de historia empresarial que los incluidos en una investigación sobre historia intelectual. Por lo pronto, aquí dejo las variables de la BD de FX Guerra.

Variables

 


Notas:

(1) François-Xavier Guerra, Del antiguo régimen a la revolución, 2 Vols., trad. de Sergio Fernández Bravo, México, Fondo de Cultura Económica, 1988 (Sección de Obras de Historia). Edición original: Le Mexique de l’Ancien Régime à la Revolution, Paris, L’Harmattan/Publications de la Sorbonne, 1985 (Travaux et mémories de l’Institut des hautes études de l’Amérique latine, 36).

Anuncios

Un pensamiento en “Historiadores y Bases de Datos 1. François-Xavier Guerra

  1. Pingback: Algunas luces para no ser dominados por las computadoras – Pensamientos carisclimáticos

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s