La Utilización de Iramuteq en Investigaciones Educativas Efrain Ticona

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

La utilización de Iramuteq en investigaciones educativas: una

perspectiva cualicuantitativa para el análisis de datos textuales

O uso do Iramuteq na pesquisa educacional: uma perspectiva


qualitative - quantitativa para a análise de dados textuais

DOI: 10.54019/sesv3n3-004

Recebimento dos originais: 05/05/2022


Aceitação para publicação: 01/07/2022

Efrain Ticona Aguilar


Doctorando en Educación del Programa de Posgrado en Educación por la
Universidad Nacional Mayor de San Marcos
Institución: Universidade Estadual de Ponta Grossa (GEPPEA)
Dirección: Praça Santos Andrade, 01, centro, Ponta Grossa - PR,
CEP: 84010-330
Correo electrónico: [email protected]

Mary Ângela Teixeira Brandalise


Doctora en Educación por la Pontifícia Universidade Católica de São Paulo
(PUC–SP)
Institución: Universidade Estadual de Ponta Grossa (GEPPEA)
Dirección: Praça Santos Andrade, 01, centro, Ponta Grossa - PR,
CEP: 84010-330
E-mail: [email protected]

Giane Correia Silva


Doctorando en el Programa de Postgrado en Enseñanza de la Ciencia y la
Tecnología de la Universidad Tecnológica Federal de Paraná
Institución: Universidade Estadual de Ponta Grossa (GEPPEA)
Dirección: Praça Santos Andrade, 01, centro, Ponta Grossa - PR,
CEP: 84010-330
E-mail: [email protected]

RESUMEN
El presente trabajo académico presenta el estudio realizado por el Grupo de
Estudio e Investigación en Política Educativa y Evaluación - GEPPEA, del
Programa de Posgrado en Educación de la UEPG, sobre el uso del software
IRAMUTEQ para el análisis de datos textuales en investigaciones en el área de
educación El programa genera varios informes, entre ellos: el análisis lexicográfico
y la nube de palabras, que muestra la frecuencia de palabras en el corpus textual;
la Clasificación Jerárquica Descendente (CHD) que identifica varias clases de
segmentos de texto y las correlaciones entre ellos; y, el análisis de similitud que
presenta las co-ocurrencias entre las palabras y el grado de similitud entre ellas.
Todos estos informes generan datos cuantitativos que permiten realizar un
análisis cualitativo en la generación de argumentos para sustentar los objetos de
estudio en investigaciones y trabajos académicos, constituyendo así una

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1059
posibilidad de análisis cualitativo y cuantitativo de datos empíricos en la
investigación educativa.

Palabras clave: análisis cualicuantitativo de datos, software iramuteq,


investigación educativa.

RESUMO
O presente trabalho acadêmico apresenta o estudo realizado no Grupo de
Estudos e Pesquisas em Política Educacional e Avaliação - GEPPEA, do
Programa de Pós-graduação em Educação da UEPG, sobre a utilização do
software IRAMUTEQ para análise de dados textuais em pesquisas na área de
educação. O programa gera vários relatórios, dentre eles destacam-se: a análise
lexicográfica e a nuvem de palavras, que mostra a frequência das palavras no
corpus textual; a Classificação Hierárquica Descendente (CHD) que identifica
diversas classes de segmentos de texto e as correlações entre elas; e, a análise
de similitude que apresenta as coocorrências entre as palavras e o grau de
similitude entre elas. Todos esses relatórios geram dados quantitativos que
permitem realizar uma análise qualitativa na geração de argumentações para
fundamentar os objetos de estudos em pesquisas e trabalhos acadêmicos,
constituindo-se dessa forma uma possiblidade de analise qualiquantitativa de
dados empíricos nas pesquisas educacionais.

Palavras-chave: análise qualiquantitativa de dados, software iramuteq,


pesquisas educacionais.

1 INTRODUCCIÓN
El procesamiento de datos cuantitativos o cualitativos se realiza desde el
punto de vista del autor en función del objeto de estudio, pero dada la multiplicidad
de posibilidades, se requiere mayor asistencia si los datos son textuales y
voluminosos.
Entre las múltiples posibilidades, el uso de programas informáticos es
grande porque permite rapidez en el procesamiento de datos cuantitativos o
cualitativos con datos textuales, aún mayor, en la organización, tabulación y
ejecución de los cálculos necesarios en el tratamiento del conjunto de datos
recogidos más aún si son voluminosos.
Así, el presente trabajo académico pretende transitar en los principales
informes del software IRAMUTEQ (Interface de R pour les Analyses
multidimensionnelles de textes et de Questionnaires) desarrollado por el
investigador francés Pierre Ratinaund (2009), los cuales son el análisis léxico
clásico, análisis de especificidades, método de clasificación jerárquica

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1060
descendente, análisis de similitud y nube de palabras.
Para el mejoramiento de los datos, el software IRAMUTEQ permite al
investigador profundizar un análisis cualitativo del objeto de estudio.

2 EL SOFTWARE IRAMUTEQ: ORIGEN Y ESTRUCTURA


En 1990, Max Reinert creó un programa innovador llamado Analyse
Lexicale par Context d’um Ensemble de Segments de Texte – ALCESTE, que
avanzó con relación a los demás existentes porque permitía recuperar el contexto
en el que se insertaban las palabras. El programa pasó a ser utilizado en Brasil, a
partir de 1998, predominantemente entre investigadores del área de las
representaciones sociales. (CAMARGO; JUSTO, 2013a). En 2011 aparece la
alternativa de análisis textual más elaborado que el software ALCESTE.
El Laboratorio de Psicología Social de la Comunicación y Cognición de la
Universidad Federal de Santa Catarina (LACCOS/UFSC), “obtuvo información de
un software libre y de fuente abierta, desarrollado por el investigador francés
Pierre Ratinaud (2009), que utiliza el mismo algoritmo que ALCESTO”.
(CAMARGO; JUSTO, 2013a, p. 515) denominado IRAMUTEQ (Interface de R
pourles Analyses Multidimensionnelles de Textes et de Questionnaires utilizando
la lógica open source que está licenciada por GNU GPL1. El programa tiene el
soporte del software R y el lenguaje phyton (www.python.org), y permite el análisis
estadístico de datos textuales de la investigación cualitativa.

2.1 INSTALACIÓN Y FUNCIOANLIDAD DEL SOFTWARE IRAMUTEQ


En el sitio web (www.iramuteq.org) es posible acceder a información sobre
el software IRAMUTEQ así como la posibilidad de descargar el programa. Es
importante que el programa R se instale antes que el software IRAMUTEQ. La
explicación para la instalación y utilización del software está disponible
gratuitamente en el tutorial del programa en portugués, desarrollado por Brigido
Vizeu Camargo y Ana Maria Justo (2013b).
El programa permite el análisis de datos textuales denominados:

1La Licencia Pública General (GNU) tiene como objetivo garantizar su libertad para compartir y
cambiar el software libre, para garantizar que el software sea gratuito para todos sus usuarios.
Están diseñados para garantizar que usted tenga la libertad de distribuir copias de software
gratuito o utilizar partes del mismo en nuevos programas gratuitos. Disponible en: www.gnu.org.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1061
lexicografía básica, referente al cálculo de frecuencia de palabras; clasificación
jerárquica descendente y análisis de similitud, entre otros. Para el análisis de datos
se debe construir un corpus textual que corresponda al conjunto de los textos, los
cuales pueden provenir de trabajos académicos (tesis, disertaciones, artículos),
informes de investigación, respuestas a cuestionarios, entrevistas, grupos focales,
informes, según el interés del investigador.
Para insertar los datos de la investigación, el investigador debe prestar
atención a las siguientes definiciones: texto, es la unidad que se tomará como dato
de investigación, por ejemplo las respuestas a una entrevista, las respuestas a
una pregunta en un cuestionario o el conjunto de resúmenes de trabajos
académicos, entre otros; corpus textual: está formado por el conjunto de textos a
analizar y corresponde al investigador organizarlos; segmento de texto: son partes
del texto definidas por el software de acuerdo al corpus textual, estando formados
en la mayoría de las veces por tres líneas. En el proceso de elaboración del
corpus, es necesario colocar todos los textos (entrevistas, artículos, textos,
documentos, respuestas de una sola pregunta) en un solo archivo de texto, lo que
se puede hacer en el software OpenOffice.org (http://www.openoffice.org/) o
Libreoffice (http://pt-br.libreoffice.org/). Y, aun así, existe la opción de trabajar con
Word de Microsoft.

2.2 A PREPARAÇÃO DO CORPUS TEXTUAL


Para preparar el corpus textual es necesario respetar las reglas de formato
definidas en el tutorial de Camargo y Justo (2013b). Inicialmente cada texto se
introduce con cuatro asteriscos (****), separados por un espacio, seguido de otro
asterisco (*) junto con la variable, seguido de un guión bajo (_) y caracteres de a-
z o A-Z o numeral. Es importante recalcar que el corpus debe construirse con al
menos una variable. Ejemplos de organización de texto son: a) ejemplo del corpus
sin tema con una variable **** *var1_1; b) ejemplo de corpus sin tema con dos
variables **** *var1_1 *var2_2; c) ejemplo de corpus temático: **** *tesis1_1
*diser2_2. Una recomendación es que el corpus textual tenga al menos 20
páginas.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1062
3 ANÁLISIS TEXTUAL EN INVESTIGACIONES
CUALITATIVAS/EDUCACIONALES
Si bien el programa elabora informes a partir de la cuantificación de las
palabras de los textos, los informes generados permiten al investigador realizar
un análisis cualitativo de los mismos, según el objeto de investigación en cuestión.
El programa cuenta con diferentes funcionalidades para el análisis de datos
textuales, los cuales pueden ser utilizados en su totalidad o parcialmente en
trabajos académicos. Más allá del fuerte rigor estadístico, su acceso es gratuito,
su interfaz es clara y comprensiva. Además, es posible identificar el contexto en
el que se insertan las palabras, lo que permite la integración de niveles cualitativos
y cuantitativos en el análisis del investigador. Sin embargo, el uso de software no
es un método de análisis, sino una herramienta que realiza el procesamiento
informático y ayuda al investigador en la organización, interpretación y análisis de
los datos. El abordaje cualicuantitativo de los datos textuales que posibilita el
programa confiere rigor y validez a los análisis realizados en las investigaciones
educativas, por lo que se recomienda el uso del software IRAMUTEQ en la
realización de investigaciones en educación.
El software permite diferentes tipos de análisis de datos textuales, entre
ellos: el análisis léxico clásico, la nube de palabras, el análisis de especificidades,
el método de clasificación jerárquica descendente y el análisis de similitudes.

3.1 ANÁLISIS LÉXICO CLÁSICO


En el análisis léxico clásico, las unidades de texto se identifican y
reformatean, transformando el "Texto" en "Segmento de texto". Esta
transformación de unidades identifica las palabras y sus frecuencias, así como la
media y el número de hapax. El software cuenta con un vocabulario que permite
reducir las palabras a una base en sus raíces, es decir, lematización que “es una
técnica generalmente utilizada por los motores de búsqueda de palabras en sitios
web, para cubrir la cantidad de opciones de palabras relacionadas con la palabra
buscada, ignorando el tiempo verbal en caso sea un verbo, o el género de la
palabra, el plural, etc.” (LOUBÈRE; RATINAUD, 2014, p. 10, traducido por
FERNANDES). Por tanto, el programa permite crear un diccionario de formas
reducidas, identificando formas activas y suplementarias (CAMARGO; JUSTO,

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1063
2013a).
La Tabla 1 presenta un ejemplo de análisis lexicográfico con las formas
activas más frecuentes en orden descendente de un trabajo de investigación.

Tabla 1 - Análisis lexicográfico con formas activas y respectivas frecuencias


Formas Frecuenci Formas Formas
Frecuencia Frecuencia
activas a activas activas
Autoevaluació
escuela 153 escolar 42 23
n institucional
educación 74 enseñanza 41 proyecto 23
proceso 73 estudio 38 resultado 23
evaluación 67 política 38 fundamental 22
evaluación
63 gestión 34 trabajo 22
institucional
investigación 53 dato 31 construcción 21
analizar 52 participación 31 practicar 20
calidad 47 básica 27 profesor 20
publicar 43 utilización 25 padres 18
Fuente: Brandalise e Ticona. Autoavaliação institucional da escola: análise da produção
académica no período 2005-2015. (2017).

Las frecuencias de las palabras contenidas en la Tabla 1 revelaron que en


el corpus textual analizado se destacaron según la frecuencia de forma
descendente. Aliado al análisis léxico, la nube de palabras se puede utilizar para
agrupar y organizar gráficamente las palabras según sus frecuencias. Se
considera un análisis léxico más sencillo, pero presenta una gráfica interesante,
ya que permite una rápida identificación de las palabras clave del corpus textual
(CAMARGO; JUSTO, 2013a).
Otra posibilidad es analizar las formas activas más frecuentes, lo que
permite establecer conexiones con el tema principal de la investigación “en que el
tamaño de letra es proporcional a la frecuencia de las palabras en el corpus textual
analizado” (SILVA; BRANDALISE, 2015, p.12). La figura 1 muestra la nube de
palabras formada por un corpus textual.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1064
Figura 1 - Nube de palabras del corpus textual analizado.

Fuente: Brandalise e Ticona. Autoavaliação institucional da escola: análise da produção


académica no período 2005-2015” (2017).

3.2 MÉTODO DE CLASIFICACIÓN JERÁRQUICA DESCENDENTE (CHD) Y


DENDROGRAMA
El Método de Clasificación Jerárquica Descendente (CHD), según
Camargo y Justo (2013a) es otra forma de análisis de datos. Están basados en
AFC, que se caracteriza por la disposición en un plano cartesiano de diferentes
palabras y variables asociadas a cada una de las clases generadas.
La validez y confiabilidad del tipo CHD presupone que existe una retención
mayor o igual al 75% de los segmentos de texto, pues si tiene un porcentaje
menor, el análisis puede ser inconsistente, ofreciendo en este caso solo una
clasificación parcial del corpus textual. Los estudiosos indican que si la retención
de segmentos de texto es inferior al 75%, se debe utilizar el análisis de
especificidad y no el método CHD.
El análisis de los datos de CHD se representa en una figura denominada
dendrograma de clase. En él hay una descripción de cada una de las clases con
el vocabulario léxico. El programa también ofrece otra forma de presentar los
resultados, a través de un análisis factorial de correspondencia realizada desde el
CHD. El programa realiza el cálculo y proporciona los segmentos de texto más
característicos de cada clase, permitiendo la contextualización del vocabulario
típico de cada clase. (CAMARGO; JUTO, 2013b).
La figura 2 muestra las relaciones entre las clases y los nombres que se les
asignan según las palabras que contienen.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1065
Figura 2 - Dendrograma y Clases Léxicas Autoavaliação Institucional da Escola: Análise da
produção académica no período 2005-2015.

Fuente: Brandalisse e Ticona. Autoavaliação institucional da escola: análise da produção


académica no período 2005-2015. (2017)

El análisis tipo CHD permite realizar un análisis cuantitativo-cualitativo de


todas las clases que genera el programa a partir del corpus textual, por lo que es
necesario que el investigador interprete y analice el comportamiento de todas las
clases.

3.3 ANÁLISIS DE SIMILITUD


La teoría de grafos2 apoya el análisis de la similitud porque permite
identificar las co-ocurrencias entre palabras, revelando la conexión entre ellas.
El análisis de similitud está representado por una figura llamada árbol
máximo, como se muestra en la Figura 3.

2 La teoría de grafos estudia objetos combinatorios - grafos - que son un buen modelo para
muchos problemas en diversas ramas de las matemáticas, la informática, la ingeniería y la
industria. Muchos de los problemas sobre grafos se han hecho famosos porque son un
interesante desafío intelectual y porque tienen importantes aplicaciones prácticas. Para obtener
más información, consulte: Breve introducción a la teoría de grafos
http://www.ime.usp.br/~pf/teoriadosgrafos/ de P. Feofiloff Y. Kohayakawa Y. Wakabayashi
(2011).

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1066
Figura 3 – Árbol máximo (de similitud)

Fuente: Brandalise e Ticona. Autoavaliação institucional da escola: análise da produção


académica no período 2005-2015. (2017)

Las relaciones entre palabras se basan en los enlaces que aparecen en las
líneas. Cuanto más grueso, mayor es la relación entre ellos. El análisis de similitud
permite hacer algunas inferencias sobre los datos analizados y también apoya el
análisis cualitativo.
La breve exposición del software IRAMUTEQ en este capítulo muestra
algunas de sus aplicaciones en la investigación académica. Como se ejemplifica
en el texto, es posible realizar un análisis cuantitativo-cualitativo de los datos
textuales pertinentes al tema y objeto de estudio investigado.

4 CONSIDERACIONES FINALES
Considerando lo expuesto en e trabajo académico, sobre el software
IRAMUTEQ, en investigaciones en el campo de las Ciencias Humanas y Sociales
es posible afirmar que posee diferentes funcionalidades para el análisis de datos
textuales, las cuales pueden ser utilizadas en su totalidad o parcialmente en
trabajos académicos. Además del fuerte rigor estadístico, su acceso es gratuito,
su interfaz es clara y comprensiva. Y es posible identificar el contexto en el que

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1067
se insertan las palabras, posibilitando la integración de niveles cualitativos y
cuantitativos en el análisis del investigador.
Sin embargo, el uso de software no es un método de análisis, sino una
herramienta que realiza el procesamiento informático y ayuda al investigador en
la organización, interpretación y análisis de los datos. Como afirma Lahlou (2012),
el software no es un método y los informes que genera no constituyen análisis de
datos. Como señalan Camargo y Justo (2013a, p. 517), el programa “IRAMUTEQ
puede ser de gran utilidad si se acompaña de un estudio sobre el significado de
los análisis léxicos y el uso de análisis multivariados, además de un buen dominio
del estado de arte”.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1068
REFERENCIAS

ALMICO, Thatianne; FARO, André. Enfrentamento de cuidadores de crianças com


câncer em processo de quimioterapia. Psic., Saúde & Doenças, Lisboa, v. 15, n.
3, p. 723-737, dez. 2014. Disponível em:
<http://www.scielo.mec.pt/scielo.php?script=sci_arttext&pid=S1645-
00862014000300013&lng=pt&nrm=iso>. Acceso en 10 may. 2022.

BRANDALISE, M.; TICONA, Autoevaluación institucional de la escuela: análisis


de la producción académica en el periodo 2005-2015. In: XII Congresso Nacional
de Educação – EDUCERE. Pontifícia Universidade Católica do Paraná, Anais
eletrônicos. Disponible en:
https://educere.pucpr.br/p1/anais.html?tipo=&titulo=&edicao=&autor=efrain+ticon
a+aguilar&area>. Acceso en: 10 may. 2022.

CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: Um software gratuito para análise


de dados textuais. Temas em Psicologia, Florianópolis, v. 21, n.2, p.513-518,
2013a. Disponible en: <http://pepsic.bvsalud.org/pdf/tp/v21n2/v21n2a16.pdf>.
Acceso en: 20 may. 2022.

CAMARGO, B. V.; JUSTO, A. M. Tutorial para uso do software de análise


textual iramuteq. Florianópolis: Universidade Federal de Santa Catarina, 2013b.
18 p.

FEOFILOFF, Paulo et al. Uma introdução sucinta à teoria dos grafos. 2011.
Disponible en:< http://www.ime.usp.br/~pf/teoriadosgrafos>. Acceso en: 10 may.
2022.

LAHLOU, S. Text mining methods: an answer to chartier and meunier. Papers


on Social Representations, 2012.

LOUBÈRE, L.; RATINAUD, P. Documentation Iramuteq. Tradução de Baltazar


Fernandes. 2014. Disponible en:
<http://www.iramuteq.org/documentation/fichiers/documentation_19_02_2014.pd
f.> Acceso en: 20 mar. 2022.

Studies in Education Sciences, Curitiba, v.3, n.3, p. 1059-1069, jul./sep., 2022 1069

También podría gustarte