Capítulo 10
EL PROCESAMIENTO DE LOS DATOS
10.1. El procesamiento como parte de la investigación
Resulta conveniente hacer ahora, al acercarnos a su final, una recapitulación del proceso de investigación tal como lo hemos expuesto hasta aquí en los capítulos precedentes. Iniciado con el planteamiento de un problema de investigación que implica responder a interrogantes situados en la frontera de los conocimientos existentes, se habrá de recorrer luego un largo camino donde será preciso atender, simultáneamente, a dos niveles diferentes: el teórico y el empírico. Para el primero de ellos nuestro trabajo se resumirá en la construcción del llamado marco teórico que, convenientemente llevado a la práctica u operacionalizado, nos indicará en definitiva qué datos es preciso obtener para satisfacer las interrogantes iniciales. En cuanto al nivel empírico nuestra aproximación a la realidad quedará concretada en un cierto tipo de diseño, implementado a través de las técnicas de recolección que nos permitirán obtener los datos requeridos. El instrumento de recolección de datos sintetizará ambos planos y será la herramienta concreta que nos proporcione la información que necesitamos.
Se abre, a partir de ese momento, la etapa propiamente dicha de la recolección de datos, que puede tener mayor o menor complejidad y duración. En ella se aplicarán los instrumentos a los objetos de estudio, lo que nos proporcionará las informaciones que necesitamos, se completarán las lecturas, se procederá a realizar efectivamente los experimentos, encuestas o estudios que sea menester.
Finalizadas las tareas de recolección el investigador quedará en posesión de un cierto número de datos, a partir de los cuales será posible sacar las conclusiones generales que apunten a esclarecer el problema formulado en los inicios del trabajo. Pero esa masa de datos, por sí sola, no nos dirá en principio nada, no nos permitirá alcanzar ninguna conclusión si, previamente, no ejercemos sobre ella una serie de actividades tendientes a organizarla, a poner orden en todo ese multiforme conjunto. Estas acciones son las que integran el llamado procesamiento de los datos.
Lo primero que suele hacerse con el conjunto de los datos obtenidos es dividirlos de acuerdo a un criterio bien elemental, separando de un lado la información que es de tipo numérica de la información que se expresa verbalmente o mediante palabras. Los datos numéricos quedarán como tales, cualquiera sea su naturaleza, y se procesarán luego para exponerlos en forma clara y fácilmente asimilable. El objetivo final será construir con ellos cuadros estadísticos, promedios generales y gráficos ilustrativos, de tal modo que se sinteticen sus valores y se pueda extraer, a partir de su análisis, enunciados teóricos de alcance más general.
Los datos que se presentan de forma verbal podrán sufrir dos destinos diferentes: se convertirán en datos numéricos o quedarán como información no cuantificada, cualitativa. Así, si se ha realizado una serie de entrevistas profundizadas, de tipo no estructurado, pueden cuantificarse algunos de los datos obtenidos Bel número de entrevistados por sexo y edad, la respuesta a alguna pregunta específicaB en tanto que otras informaciones se mantendrán en su forma verbal, como paradigmas o ejemplos de las opiniones de la muestra frente a ciertos problemas de interés. El criterio a adoptar dependerá de circunstancias concretas: de los objetivos del trabajo, de la posibilidad de cuantificar cada variable, del tamaño del universo o muestra considerados y de varios otros criterios. En todo caso se debe tener presente que, siempre que tenga sentido, es preferible cuantificar en lo posible los datos obtenidos. No existe, como pretenden algunos metodólogos parcializados, ninguna oposición entre datos cuantitativos y datos cualitativos: lo que existe es un diferente grado de precisión y de complejidad en cada una de las variables que medimos, de modo tal que siempre es posible abstraer de ellas algunos aspectos cuantitativos en tanto que otros, por su complejidad, tendrán que permanecer como cualitativos.
Una vez adoptado un criterio frente a cada categoría o subconjunto de datos se podrán abordar ya, con mayor claridad acerca de nuestros objetivos, las tareas básicas del procesamiento. En primer lugar será preciso hacer una revisión detallada de todos los datos obtenidos, atendiendo en especial a su coherencia. Si se trata de cuestionarios o de pautas de observación, de registros de tests, sociogramas, o de cualquier otro instrumento de recolección, habrá que examinar cada uno de ellos para analizarlos internamente, buscando sus posibles incongruencias, omisiones o errores, y enmendándolos si cabe hacerlo. Es decir, se revisará sistemáticamente toda la información disponible, juzgando su calidad y el grado de confianza que merece, para determinar qué parte puede incluirse en el informe de investigación, cual debe corregirse o modificarse en algo (acudiendo, llegado el caso, a una nueva recolección de datos) y cual, por sus graves deficiencias, deberá ser excluidas sin más. Por cada tipo de datos se procederá entonces como sigue:
Los datos numéricos se procesarán agrupándolos en intervalos y se tabularán. Luego se construirán con ellos cuadros estadísticos, calculándose además las medidas de tendencia central, de dispersión o de correlación que resulten necesarias. | |
Los datos verbales que se desea presentar como numéricos sufrirán una primera operación que se denomina codificación. De allí en adelante se trabajarán al igual que los otros datos numéricos, mediante la tabulación y el procesamiento en cuadros estadísticos. | |
Los datos verbales que habrán de manejarse en forma puramente conceptual y no matemática seguirán el proceso que indicaremos cuando tratemos el parágrafo relativo a datos secundarios (ver 10.5). |
DATOS PROCESOS
Codificación Tabulación Construc. de cuadros
Numéricos No Sí Sí
Verbales
A transformarse en numéricos Sí Sí Sí
Que permanecen como información verbal No No No
10.2. La codificación
La codificación es un procedimiento que tiene por objeto agrupar numéricamente los datos que se expresen en forma verbal para poder luego operar con ellos como si se tratara, simplemente, de datos cuantitativos. Para lograrlo se habrá de partir de un cúmulo de informaciones que tengan una mínima homogeneidad, condición necesaria para poder integrarlas. Pueden tratarse de cientos de respuestas a una misma pregunta o de una variedad de posibles situaciones observadas mediante un mismo ítem de una pauta de observación: en ambos casos existirá una determinada variedad de declaraciones o de observaciones que presenten las respuestas o los comportamientos de los objetos de estudio.
El primer paso a dar frente a todos estos datos es realizar una revisión atenta de un subgrupo reducido de ellos con el objeto de encontrar una tipología de respuestas posibles, en concordancia, por otra parte, con las formulaciones teóricas que guían la investigación y con los criterios adoptados en la etapa de operacionalización. A cada categoría de respuestas habremos de darle un código particular, un número o letra diferente, que servirá para agrupar tras de sí a todas las respuestas u observaciones que sean idénticas o que, al menos, aparezcan como equivalentes. Luego procederemos a señalar a cada uno de los cuestionarios u hojas de observación con el código que le corresponde en cada caso, con lo que quedará sintetizada la respuesta que contiene. El proceso se facilita grandemente cuando se realiza mediante computadoras.
Supongamos que hemos preguntado, por medio de entrevistas estructuradas hechas a una muestra, la opinión que tienen las personas respecto a las Naciones Unidas. Si la pregunta ha sido abierta cada respondente habrá expuesto sus opiniones en algunas breves frases. La codificación nos permitirá agrupar sus respuestas, para poder evaluar cuáles son las opiniones más salientes al respecto. Nuestros códigos, por ejemplo, podrán ser:
1. Es una institución que promueve (o protege, o garantiza) la paz mundial.
2. Es una institución burocrática que debería ser reformada.
3. Es útil por los servicios que presta a los países menos desarrollados.
4. Es inoperante, ineficiente, inútil, etc.
5. No tiene idea de qué es, no tiene opinión o no quiere opinar al respecto.
Por supuesto que podrían elaborarse otros códigos, categorizando más o menos detalladamente las respuestas. Casi siempre que se encuentran ideas similares pero que se expresan a través de palabras diferentes se procede a unificarlas en un mismo código. Excepcionalmente, cuando no sólo interesa la idea básica sino además los aspectos lingüísticos con que ésta se manifiesta, es necesario buscar un código para cada respuesta tomada textualmente. Los casos difíciles de ubicar, de respuestas que pudieran situarse en más de una categoría, sólo pueden ser resueltos consultando con el marco teórico planteado inicialmente. Cuando aparecen respuestas ambiguas, extrañas o simplemente anómalas, es conveniente agruparlas en el código Aotras respuestas", para no abrir demasiadas categorías a una sola pregunta pues eso puede dificultar el análisis.
Una vez definidos estos códigos, y ya marcados los cuestionarios o pautas con los mismos, estaremos en condiciones de proceder a la subsiguiente etapa, la de tabulación.
10.3 La tabulación
La palabra tabulación deriva etimológicamente del latín tabula, y significa hacer tablas, listados de datos que los muestren agrupados y contabilizados. Para ello es preciso contar cada una de las respuestas que aparecen, distribuyéndolas de acuerdo a las categorías o códigos previamente definidos. Cada una de las preguntas de un cuestionario o de una hoja de observación tendrá que ser tabulada independien- temente, por lo que es preciso hacer previamente un plan de tabulación que prepare adecuadamente la tarea a realizar.
Esta etapa del trabajo puede desarrollarse manualmente, mediante el procedimiento que esbozaremos a continuación, cuando se trate de un número relativamente pequeño de datos; cuando esto no sea así resultará mejor acudir al procesamiento electrónico de datos, para lo cual existen ya adecuados paquetes de computación que facilitan grandemente esta tarea. Para ello es necesario preparar los instrumentos de recolección con casilleros especiales de registro para que las máquinas los procesen.
Para realizar una tabulación manual deberán confeccionarse planillas u hojas de tabulación donde figuren los códigos sobre la base de los cuales se habrán de distribuir los datos. También deben dejarse espacios para señalar, mediante signos convencionales, las unidades que se van contabilizando. En la columna de códigos se anotarán cada uno de los que se hayan establecido en el proceso de codificación de la variable, si ésta no se presentaba inicialmente en forma cuantificada. Si no es así, irán directamente los intervalos establecidos para la distribución. En el espacio reservado a las respuestas se colocará, por cada cuestionario que se tabule, un signo en la categoría que corresponda según la respuesta que en él aparezca. Una vez tabulados todos los cuestionarios se contarán las respuestas anotadas en cada casillero, expresándose en números en la columna del total.
El resultado de la tabulación será este cómputo ordenado de las respuestas. Sin embargo, las tablas así obtenidas no serán aptas todavía para presentarse al público, pues deberán sufrir algunas transformaciones de forma que permitan su mejor comprensión, como veremos en la sección correspondiente (10.4). Las tablas que resultan de la tabulación deben considerarse, por lo tanto, como un material de trabajo, como un producto preliminar todavía no completamente terminado.
10.3.1. Tabulación de dos variables
La explicación que hemos dado hasta aquí se ha referido al caso más simple de la tabulación, es decir, el que se ocupa del procesamiento de una sola variable o indicador. Casi siempre resulta necesario presentar simultáneamente las mediciones correspondientes a dos o más variables, en especial para tratar de percibir si se presenta algún tipo de correlación o asociación entre ellas. Para alcanzar este objetivo se emplea una tabulación llamada cruzada, o de doble entrada, que consiste en la contabilización de las respuestas a una pregunta discriminándolas de acuerdo a las de otras variable diferente.
Nuestra planilla de tabulación manual quedaría de la siguiente manera, si pretendiéramos tabular los datos del ejemplo anterior cruzándolos con los de la variable edad:
Preg. No. .. x preg. No. ..
OPINION RESPECTO A LA ONU, SEGUN EDAD
Edades Hasta 25 años De 26 a 45 años 46 y más años Total
Códigos
Código 1 B
Código 2 A
Total
Si el primer cuestionario que tomáramos fuera de una persona de 23 años cuya opinión sobre el tema debería incluirse en el código No.2, tendríamos que hacer una señal en la casilla o celda que hemos marcado con la letra A. Luego tomaríamos otra respuesta, por ejemplo la de una persona de 37 años cuya respuesta pudiera incorporarse al código No.1; haríamos así otra marca, esta vez en el casillero señalado con una B. Es decir que, antes de efectuar la marca que nos permite ir contando cada caso, tendríamos que ubicar al mismo de acuerdo a las dos categorías que intervienen en nuestra tabla. Cuando completáramos todos los casos de la muestra estaríamos en posesión de un cuadro de doble entrada, capaz de informarnos si las opiniones frente al tema se ven afectadas por la edad de los entrevistados o si, por el contrario, se distribuyen de modo uniforme cualquiera sea la edad de éstos.
Los paquetes de tabulación por computadoras hacen esta tarea con gran rapidez, una vez que se les transfieren los datos correspondientes a cada cuestionario. Ellos operan, en última instancia, siguiendo la misma lógica del ejemplo que acabamos de exponer.
10.3.2. Total de las respuestas tabuladas
Cuando tabulamos respuestas a preguntas abiertas o cerradas, pero que permiten elecciones múltiples, el total de respuestas obtenidas podrá ser mayor, menor o igual al del total de entrevistados. Esto, que puede resultar sorprendente, no se debe a ningún error sino a consideraciones muy simples. En primer lugar, puede suceder que algunas personas no respondan a determinadas preguntas, por lo que el total de respuestas sería entonces menor que el de respondentes. Pero puede suceder un fenómeno que produce resultados contrarios: algunas personas tal vez den dos respuestas diferentes para una misma pregunta, cosa que es perfectamente aceptable siempre que ellas no sean contradictorias entre sí.
Veamos lo dicho con un ejemplo: Supongamos que hemos entrevistado a 50 personas que han migrado desde el campo a la ciudad y que una de las informaciones solicitadas ha sido la causa que provocó esa migración. Algunas de ellas podrán decir que han migrado por motivos de trabajo, otras por problemas de salud, para proseguir sus estudios, para reunirse con el resto de su familia, etc. Pero pueden haber algunos migrantes que se hayan dirigido a la ciudad para estudiar y trabajar a la vez, o por motivos de salud y simultáneamente para reunirse con sus familiares. Existirán múltiples posibilidades al respecto, incluso la de que algunos de ellos se nieguen a expresar sus respuestas o eludan la pregunta de diversas maneras. Después del trabajo de codificación podríamos obtener la siguiente lista de motivos de migración:
1: Motivos económicos
2: Motivos de salud
3: Deseos de reunirse con sus familiares
4: Deseos de proseguir estudios
5: Otros motivos
Si del total de 50 personas encuestadas han respondido solamente 46, pero si hay varias de ellas que han expresado más de un motivo como causa de su presencia en la ciudad, podría presentársenos la siguiente situación:
Total de entrevistados 50
Total responden a la pregunta 46
Motivos indicados:
Económicos 27
De salud 2
Familiares 12
Educacionales 11
Otros motivos 3
Total respuestas 55
Como se ve, estamos frente a tres cantidades distintas que nos indican diferentes cosas: una es el total de gente consultada, otra el de la que efectivamente respondió y otra el total de las respuestas dadas, teniendo siempre presente que cada persona ha podido dar más de una respuesta. La tabulación nos indica que han sido 27 los entrevistados que dijeron haber migrado por razones de tipo económico, 2 por problemas de salud y así sucesivamente. En conjunto, del total de 50 entrevistados sólo 46 han respondido a la pregunta. Estos 46 han dado, por otra parte, un total de 55 respuestas porque algunos de ellos han expresado más de un motivo como causa de su traslado permanente a la ciudad.
Cuando se trate de tabular respuestas de elecciones múltiples debe tenerse en cuenta que hay que tabular separadamente estos tres elementos, contando el total de cuestionarios, el total de quienes no responden y el total correspondiente a cada código o intervalo para obtener estas tres cantidades diferentes. Las escalas que resultan de este tipo de tabulación, como se comprenderá, no poseen categorías mutuamente excluyentes puesto que derivan de una pregunta abierta donde es posible hacer una elección múltiple.
10.4. Cuadros estadísticos
Decíamos que luego de terminar con la tabulación de toda la información contenida en nuestros instrumentos de recolección era preciso presentar los resultados de modo tal que estos se hiciesen fácilmente inteligibles aun para los lectores no especializados. Para lograrlo es preciso presentar los datos en la forma más clara posible, haciendo explícito cualquier elemento que pueda dar origen a confusiones o dobles interpretaciones y ordenando toda la información de la manera más rigurosa.
Este criterio se manifiesta, en primer lugar, en el correcto titulado de cada cuadro. Ello significa que el título debe contener todas las características de la información que se presenta, en forma concreta, específica y no difusa. Si hiciéramos la pregunta: )Dónde piensa Ud. ir en sus próximas vacaciones?, el cuadro estadístico correspondiente debería titularse, sencillamente: ALugares a donde los entrevistados piensan ir en sus próximas vacaciones". No podemos hablar ambiguamente aquí de ALugares preferidos por los entrevistados", pues no siempre la gente acude de vacaciones a los sitios que más prefiere. Tampoco se debería encabezar la información con el título ALugares donde pasan sus vacaciones los entrevistados", pues una persona puede tener decidido ir a un cierto sitio pero luego no hacerlo por diversas razones.
Cuando en un cuadro aparecen dos variables deberá mencionarse primero aquella que suponemos dependiente y luego la independiente. Así quedaría, v.g.: AOpinión de los entrevistados frente al control de la natalidad, según su edad". Si existen más variables se respetará la misma regla, anotando para el caso mencionado: AOpinión de los entrevistados frente al control de la natalidad, según sexo y edad".
Después de encontrar un título adecuado para el cuadro, la tarea siguiente es convertir en porcentajes las cifras reales (llamadas absolutas) que hemos obtenido de la tabulación. Ello permite, por una parte, tener una mejor idea de lo que puede representar una parte frente al todo. Es muy claro lo que significa que 23% de la gente prefiere X y no Y. En cambio no percibimos tan claramente el valor relativo de 171 respuestas favorables a X sobre el total de 743 casos. De la misma manera, la práctica de la porcentuación permite, de una rápida ojeada, percibir diferencias y similitudes, apreciar variaciones y tendencias y hacer comparaciones con otras investigaciones. Por ello su uso es constante prácticamente en todos los cuadros estadísticos.
El valor en función del cual se hace el cálculo de los porcentajes (en el ejemplo anterior, 743), se llama base del porcentaje. Cuando tal base es un número demasiado pequeño no se suelen calcular los porcentajes, pues hacerlo podría inducir a que el lector se hiciese una idea falsa acerca de la exactitud de la información: no tiene mucho sentido decir que 83,3% de los integrantes de una muestra poseen automóvil por el simple hecho de que, sobre seis personas consultadas, haya cinco que sí lo posean. Por eso, cuando la base es menor de 15 o de 20 casos (el límite se fija convencionalmente) se suele presentar la información en cifras absolutas y no relativas.
Puede ocurrir que, en un cierto cuadro, aparezcan diferentes bases, algunas de las cuales puede llegar a ser menores que las cifras fijadas como mínimas. Por más que esto suceda nunca, en ningún caso, deben presentarse en un mismo cuadro columnas en porcentajes y en valores absolutos simultáneamente. O se presentan sólo cifras absolutas o sólo valores porcentuales o Bsi ello no es posibleB se trata de acudir a recursos tipográficos que permitan al lector distinguir con claridad las dos categorías diferentes de cifras.
Las cifras presentadas deben tender a redondearse en lo posible, pues se introduce cierta confusión al mencionar que hay 32,87% de una cierta categoría y 67,13% de la contraria. Mucho más simple es hablar de 33% contra 67 por ciento. Por supuesto que, cuando mayor sea la muestra, más aceptable es incluir decimales en las cifras presentadas. Si las bases son pequeñas, en cambio, hay que evitar dar la impresión de una exactitud que la información, en realidad, no posee.
Cuando se trate de un cuadro que expone una pregunta de elección múltiple la base del porcentaje será siempre el total de personas que responden y no el total de respuestas existentes, pues es lo que tiene más sentido lógico: decir que un 54% de los entrevistados ha migrado por motivos económicos Bde acuerdo a los datos de la tabla presentada en 10.3.2B tiene mucho más sentido que decir que un 49% de las respuestas dadas por los entrevistados aluden a motivos económicos.
10.4.1. Cuadros con una sola variable
Se trata del caso más simple que pueda presentarse y no plantea ninguna dificultad para su construcción. Simplemente se trata de presentar una columna ordenada de valores de acuerdo a ciertos modelos formales convencionales. Existen dos modelos básicos de presentación, que ejemplificaremos seguidamente:
Primer modelo:
Cuadro No. ... :
EDADES DE LOS ENTREVISTADOS
Total de la muestra 250
Total respondieron 247
%
Hasta 25 años 30
De 26 a 39 años 25
De 40 a 59 años 21
De 60 y más años 24
Aquí la base se coloca en la parte superior de la columna y se subraya (o se pone en cursiva) para indicar que sobre ella se han calculado los valores porcentuales.
En el segundo modelo, en cambio, la cifra sobre la cual se calculan los porcentajes se coloca al pie de la columna y encerrada entre paréntesis, en tanto que el total de la muestra se anota aparte, generalmente más abajo:
Segundo modelo:
Cuadro No. ...:
EDADES DE LOS ENTREVISTADOS
Hasta 25 años 30
De 26 a 39 años 25
De 40 a 59 años 21
De 60 y más años 24
(247)
Total de la muestra 250
Cualquiera de estos dos formatos es correcto. Su utilización depende de la voluntad del autor y, en gran parte, del modelo que sea usual en cada institución, localidad o empresa. Las variaciones o diferentes modelos de presentación que puedan usarse en otras ocasiones serán aceptables si, en cada caso, permiten distinguir con nitidez qué guarismos corresponden a valores porcentuales, cual es el tamaño de la muestra y cual es el número total de personas que responden a cada pregunta.
10.4.2. Cuadros con dos o más variables
Son los que presentan el comportamiento simultáneo de más de una variable, cuando se trata de mostrar sus interrelaciones recíprocas. Surgen de tabulaciones cruzadas (ver 10.3.1.) y se llaman de doble o triple entrada, según la cantidad de variables incluidas en ellos. En cuanto a su diseño, es universalmente aceptado que la variable supuestamente independiente se coloca en sentido horizontal, mientras que la dependiente se sitúa en forma vertical.
Daremos un ejemplo sencillo para ilustrarlo. Sea la variable independiente la edad, que se supone ejerce algún tipo de influencia sobre las opiniones de la gente tiene frente al problema X. Nuestro cuadro quedaría así:
Opiniones Edades (años)
Hasta 25 26 a 39 40 y más Total
Total entrevistas 83 103 61 247
% % % %
A favor 17 28 44 28
Neutral 23 22 25 23
En contra 52 47 20 42
No sabe/No contesta 8 3 11 7
Para el caso de cuadros que posean tres o más variables el criterio que se adopta es situar a la variable dependiente, como antes, en la vertical, mientras que las independientes o intervinientes se sitúan en la horizontal. Debemos agregar que, salvo excepciones muy poco frecuentes, nunca se presenta la información en cuadros de más de tres entradas, pues el análisis y la comprensión de cuadros más complejos se hace realmente difícil, incluso para gente especializada. Esta restricción no rige, naturalmente, durante el procesamiento de la información, por lo que en las planillas de tabulación y en las hojas de cálculo computarizadas es frecuente encontrar muchas variables que se cruzan simultáneamente.
10.4.3. Graficación
La graficación es una actividad derivada de la anterior que consiste en expresar visualmente los valores numéricos que aparecen en los cuadros. Su objeto es permitir una comprensión global, rápida y directa, de la información que aparece en cifras. Es sumamente útil, especialmente cuando nos dirigimos a lectores con poca preparación matemática, aunque siempre es recomendable por el valor de síntesis que posee.
Raramente se grafica toda la información que se presenta en una investigación pues ello ocuparía un espacio desmesurado en el informe de investigación, lo que podría más bien a confundir al lector. Lo corriente y más aconsejable es graficar las informaciones más importantes y generales que se presten a una expresión gráfica.
Para llevar adelante esta tarea existe una infinidad de formas posible que incluyen, entre las más conocidas, los gráficos de barras, los histogramas, los gráficos de Apastel", las escalas gráficas, etc. El criterio del investigador Bjunto con sus conocimientos matemáticosB serán los encargados de determinar cuál es el gráfico más apropiado para cada conjunto de datos. [V. Caude, Roland, Iniciación a los Gráficos, Ed. Sagitario, Barcelona, 1969.] Actualmente casi todos los gráficos se realizan mediante el uso de paquetes especializados de computación, que no sólo dibujan e imprimen los gráficos deseados, sino que también realizan labores de cálculo que facilitan la presentación de los datos de la investigación.
10.5. Procesamiento de datos secundarios
Incluimos en este punto las operaciones que es necesario realizar con aquellos datos verbales que no se puede o quiere cuantificar, y que por lo tanto se habrán de mantener en forma puramente cualitativa (ver 10.1). Por lo general, la mayoría de estas informaciones se recolecta mediante fichas, a las que nos referiremos de ahora en adelante, aunque las consideraciones que exponemos son válidas, en general, para todo tipo de información verbal.
Partimos, entonces, de una masa de datos, donde se supone que se encuentra la información necesaria para desenvolver la investigación. Estos datos, sumados a la experiencia del investigador, permitirán y desarrollar las respuestas a los interrogantes iniciales de la investigación o servirán, de un modo más limitado, para esclarecer ciertos puntos específicos que es preciso exponer: marco teórico, antecedentes históricos del problema, etc.
La primera labor que hay que realizar es ordenar esta masa de datos de modo tal que podamos efectuar sobre ella una inspección sistemática y profunda. Tal clasificación sólo puede hacerse en base al esquema general de exposición o presentación de la investigación, al listado ordenado de capítulos y de puntos que ya se debe haber elaborado (cf. supra, 6.6). Este esquema nos permitirá agrupar el material de acuerdo a los temas que se tratan y en función del marco teórico que orienta el trabajo en general.
Cada una de las fichas se agrupará entonces con las otras que se refieren al mismo punto de investigación. Una vez así clasificadas estarán en condiciones de ser cotejadas entre sí y analizadas, de acuerdo a los métodos que se expondrán en el capitulo siguiente. Las modernas bases de datos permiten realizar con mayor facilidad esta tarea que, por lo general, antes resultaba bastante tediosa.
Ejercicios
10.1. Diseñe una planilla para efectuar la tabulación cruzada de estos dos indicadores: marca de automóvil usada y razones de preferencia por dicha marca.
10.2. Construya un cuadro de doble entrada según las variables del ejercicio anterior. Póngale un título apropiado y trate de imaginar datos que, razonablemente, pudieran haberse recogido para una muestra de un total de 1.200 usuarios de automóvil.
10.3. Construya uno o varios gráficos que permitan apreciar los datos del ejercicio anterior.
10.4. Averigüe la forma en que Johan Kepler procesó los datos conocidos sobre las órbitas planetarias para llegar a la conclusión de que éstas son elípticas y no circulares, como hasta entonces se creía.
10.5. )Cómo haría ud. para tener actualizados los datos de las ventas de una empresa? Explique qué variables tomaría en cuenta, qué cuadros diseñaría y qué instrumental (archivos, sistemas de computación, registros, etc.) requeriría para ello. Piense en un sistema similar para el registro de los datos académicos de los estudiantes de una universidad.
10.6. )Por qué resulta útil procesar la información en la forma que se expone en la tabla de 10.3.2, a pesar de que las categorías que aparecen no son mutuamente excluyentes?
10.7. )Con qué criterios procesaría la información bibliográfica que Ud. conoce sobre historia de la ciencia, si quisiese comprender las diferencias que se presentan entre el desarrollo histórico de las ciencias sociales y el de las físico-naturales?