Derechos de autor 2022 Investigación e Innovación en Ingenierías

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Aplicación de la minería de texto a la identificación de enfoques temáticos en un grupo de investigación
Corresponding Author(s) : Ivón Romero Pérez
Investigación e Innovación en Ingenierías,
Vol. 10 Núm. 2 (2022): Julio-Diciembre
Resumen
Objetivo: Develar las características, enfoques temáticos y dinámica de trabajo de un grupo de investigación a partir de la aplicación de la minería de texto como técnica de análisis de información. Método: Es un estudio bibliométrico de carácter cuantitativo basado en la aplicación de técnicas lexicométrica y de minería de texto. La muestra es intencional y no probabilística, compuesta por 185.212 ocurrencias de 40 documentos publicados por un grupo de investigación registrado en la plataforma GrupLAC del sistema de información científica de Colombia. Resultados y discusiones: Se extraen los dominios temáticos, objeto de estudio, población y contextos de la producción intelectual, se identifica la dinámica de trabajo de los investigadores y se establecen los principales enfoques temático de investigación del grupo. sin embargo, para validar estos resultados es indispensable la participación de un experto en la identificación de dichas categorías de análisis. Conclusiones: La minería de texto es una herramienta fundamental para evaluar la producción y dinámica de trabajo de un grupo de investigación, ya que devela con certeza los enfoques de temáticos que desarrollan los investigadores. Asimismo, contribuye al fortalecimiento de las políticas públicas que están orientadas al desarrollo de la investigación científica en un país.
Palabras clave
Descargar cita
Endnote/Zotero/Mendeley (RIS)BibTeX
- G. Pérez Reyes y A. Martínez Rodríguez, La Ciencia como empresa social: su evaluación desde la bibliometría. Biblios [Revista electrónica]. No. 55, pp. 27-39., 2014. DOI: https://doi.org/10.5195/biblios.2014.157.
- R. Sancho, Indicadores bibliométricos utilizados en la evaluación de la ciencia y la tecnología. Revisión bibliográfica. Revista española de documentación científica [Revista electrónica]. Vol. 13. Núm. (3-4), pp. 842-865., 1990. Disponible en: https://digital.csic.es/handle/10261/23694
- A. Castillo y M. Carretón, Investigación en comunicación: estudio bibliométrico de las revistas de comunicación en España. Comunicación y Sociedad [Revista electrónica]. Vol. XXIII, Núm. (2), pp. 289-327., 2010. Disponible en:
- http://hdl.handle.net/10045/22678.
- V. Tomás Górriz y V. Tomás-Casterá, La Bibliometría en la evaluación de la actividad científica. Hosp Domic [Revista electrónica]. Vol. 2 Núm. (4), pp. 145-63., 2018. DOI: http://doi.org/10.22585/hospdomic.v2i4.51
- E. Spinak, Indicadores Cienciométricos. Ciência da informação [Revista electrónica]. Vol. 27 Núm. (2), pp. 141-148., 1998. Disponible en: http://revista.ibict.br/ciinf/article/view/795
- J. Amézquita López, D. Martínez Torres, J. Martínez Torres y F. Maza Ávila. Bibliometría, infometría y cienciometría. Proyecto de investigación: Diseño e implementación de la catedra CTS+ I (Ciencia, Tecnología, Sociedad e Innovación) en la Universidad de Cartagena. Cartagena: Ediciones Unicartagena, 2011.
- Y. Pérez Guadarramas, A. Rodríguez Blanco, A. Simón Cuevas, W. Hojas-Mazo, y J. Olivas, Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos. Procesamiento del Lenguaje Natural [Revista electrónica]. Núm. 59, pp. 39-46., 2017. Disponible en: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5491
- E. Sanz y C. Martin, Técnicas Bibliométricas aplicadas a los estudios de usuarios. Revista General de Información y Documentación [Revista electrónica]. Vol. 7 Núm. (2), pp. 42-64., 1997. Disponible en: https://revistas.ucm.es/index.php/RGID/article/view/RGID9797220041A
- M. Peralta, M. Frías y O. Chaviano, Criterios, clasificaciones y tendencias de los indicadores bibliométricos en la evaluación de la ciencia. Revista Cubana de Información en Ciencias de la Salud [Revista electrónica]. Vol. 26 Núm. (3), pp. 290-309, 2015. Disponible en: http://www.redalyc.org/articulo.oa?id=377645762009.
- B. Velasco, J. Eiros, J. Pinilla y J. San Román, La utilización de los indicadores bibliométricos para evaluar la actividad investigadora, Aula Abierta, [Revista electrónica]. Vol. 40 Núm. (2), pp. 75-84., 2012. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=3920967
- R. Ruiz y R. Bailón, El método de las palabras asociadas (I): La estructura de las redes científicas. Boletín de la Asociación de la Revista Andaluza de Bibliotecarios [Revista electrónica]. Vol. 14 Núm. (53), pp. 43-60, 1998. Disponible en: http://eprints.rclis.org/13003/
- C. Gálvez, Análisis de co-palabras aplicado a los artículos muy citados en Biblioteconomía y Ciencias de la Información (2007-2017). Transinformação, v30(3), 277-286., 2018. http://dx.doi.org/10.1590/2318-08892018000300001
- D. Swanson, “Complementary structures in disjoint science literatures.” Presented in Proceedings of the 14th Annual International ACM/SIGIR Conference. University of Chicago, September 1991. DOI: https://dl.acm.org/doi/10.1145/122860.122889
- M. Hearst, “Untangling text data mining.” Presented in Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics. Association for Computational Linguistics, University of California, June 1999. https://aclanthology.org/P99-1001.pdf
- D. Sullivan, Document warehousing and text mining. New York: Wiley Computer Publishing, 2001.
- R. Feldman, J. Sanger, The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Pres, 2007.
- Rochina, P. (25 abril, 2017). ¿Qué es y cuáles son las aplicaciones del Text Mining? Revista digital INESEM [Blog personal]. Disponible en: https://revistadigital.inesem.es/informatica-y-tics/text-mining/
- E. Brun, y Senso, J, Minería textual. El Profesional de la Información [Revista electrónica]. Vol. 13 Núm. (1), pp. 11–27., 2004. Disponible en: http://eprints.rclis.org/11491/1/Artmineriapdf.pdf
- S. Ravikumar, A. Agrahari, y Y. Singh, Mapping the intellectual structure of scientometrics: A co-word analysis of the journal Scientometrics (2005–2010). Scientometrics [Revista electrónica]. Vol. 102 Núm. (1), pp. 929-955., 2015. https://doi.org/10.1007/s11192-014-1402-8
- B. Contreras, Minería de texto en la clasificación de material bibliográfico. Biblios, [Revista electrónica]. Núm. (64)., 2016. Disponible en: http://biblios.pitt.edu/ojs/index.php/biblios/article/view/309
- D. De Filippo, y L. Levin, Detección y análisis de “clúster bibliográfico” en las publicaciones de Iberoamérica sobre ciencia, tecnología y sociedad (1970-2013), Investigación Bibliotecológica, [Revista electrónica]. (número especial), pp. 123-148., 2017. Disponible en: http://rev-ib.unam.mx/ib/index.php/ib/article/view/57888/51919
- A. Valero. “Técnicas estadísticas en Minería de texto” (Tesis de grado). Dpto de Estadística e Investigación Operativa, Universidad de Sevilla, Sevilla, España. 2017. Disponible en: https://idus.us.es/handle/11441/63197
- M. Pérez, y C. Cardoso, Minería de texto para la categorización automática de documentos, Cuadernos de la Facultad, [Revista electrónica]. Núm. (5), pp. 11-45., 2010. Disponible en: https://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-alicia-articulo-cuadernos-formateado.pdf
- D. Murillo y D. Saavedra. “Implementación de algoritmo en el Lenguaje R para extraer los datos de los Perfiles en Google Scholar utilizando la técnica web Scraping de Minería de datos”. Trabajo presentado en el X Congreso de Computación para el Desarrollo, COMPDES [En línea]. 2017. https://ridda2.utp.ac.pa/bitstream/handle/123456789/3105/vipe-algoritmo-google-scholar.pdf?
- sequence=1&isAllowed=y
- M. Bordons y M. Zulueta, Evaluación de la actividad científica a través de indicadores bibliométricos. Revista Española de Cardiología, [Revista electrónica]. Vol. 52. Núm. (19), pp. 790-800., 1999. https://doi.org/10.1016/S0300-8932(99)75008-6
- F. Ruiz, Estudio Bibliométrico sobre la Producción Científica en la UCLM. España: Departamento de Tecnologías y Sistemas de Información, Universidad de Castilla-La Mancha., 2012. Disponible en: http://alarcos.inf-cr.uclm. es/per/fruiz/wos-uclm/
- U. Fayyad, G. Piatetsky-Shapiro y P. Smyth, Knowledge Discovery and Data Mining: Towards a Unifying Framework. KDD-96 Proceedings, [Revista electrónica]. pp. 82-88. https://www.aaai.org/Papers/KDD/1996/KDD96-014.pdf
- L. Lebart, A. Salem y M. Bécue, Análisis estadístico de datos y textos. España: Milenio, 2000.
- M. Páramo, Significados de adolescencia y psicoterapia: análisis lexicométrico de discursos grupales. Acta Colombiana de Psicología, [Revista electrónica]. Vol. 13 Núm. (2)., 2010. Disponible en: https://actacolombianapsicologia.ucatolica.edu.co/article/view/377
- D. Hernández. “BiblioMineR: una herramienta estadística para la revisión bibliográfica” (Tesis de Maestría). Universidad Politécnica de Catalunya, Barcelona, España, 2012. http://hdl.handle.net/2099.1/16500
- B. Lee y Y. Jeong, Mapping Korea's national R&D domain of robot technology by using the co-word analysis. Scientometrics, [Revista electrónica]. Vol. 77 Núm. (1), 3-19., 2008. https://doi.org/10.1007/s11192-007-1819-4
- R. Caraguay. “Aplicación de técnicas de minería de texto para el agrupamiento de componentes académicos en base a los contenidos de planes docentes”. (Trabajo de pregrado). Universidad Técnica Particular de Loja, Ecuador, 2016.
- P. Murphy, Basic Text Mining in R. [Online]. 2017. Disponible en : https://rpubs.com/pjmurphy/265713
- M. Bécue Bertaut. Mesurem els mots ? L ' anàlisi estadística de textos. En A. Ventura (Presidencia), I Jornades de Llengua i Estadística. Ponencia llevada a cabo en la de Lengua- Estadística de l'Idescat, Barcelona, España, 2009.
- M. Vallez, y R. Pedraza Jiménez, El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines. Hipertext.net, [Revista electrónica]. Núm. 5, 2007. Disponible en: https://www.upf.edu/hipertextnet/numero-5/pln.html
- G. Salton, “Automatic text processing: the transformation, analysis, and retrieval of information by computer.” Boston: Addison-Wesley Longman Publishing Co, 1989.
- L. Oliva, M. Hernández, y C. Castro, Más que palabras nos dicen los adolescentes que desean migrar. Estudio estadístico de las respuestas a una pregunta. Revista de Psicología Social Aplicada, [Revista electrónica], Vol. 1 Núm. (1), pp. 55–73., 2012. Disponible en: https://revistas.innovacionumh.es/index.php/lexmercatoria/article/view/892
- A. Jain, M. Murty, y P. Flynn, Data clustering: a review. ACM computing surveys (CSUR), [Revista electrónica], Vol. 31 Núm. (3), pp. 264-323, 1999. Disponible en: https://dl.acm.org/doi/10.1145/331499.331504
- F. Wickelmaier, “An Introduction to MDS.” Dinamarca: Aalborg University, 2003.
- I. Romero-Pérez, Y. Alarcón-Vásquez, y J. García-Jiménez, Lexicométrica: Enfoque aplicado a la redefinición de conceptos e identificación de unidades temáticas. Biblios, [Revista electrónica] Núm. 71., 2018. Disponible en: http://biblios.pitt.edu/ojs/index.php/biblios/article/view/466/0
- I. Romero-Pérez, y E. Latorre-Iglesias, Listado de documentos seleccionados para el análisis y visualización de las tendencias y dinámicas de producción del grupo de investigación Joaquín Aaron Manjarrés (2011-2017)., 2018. Figshare. Journal contribution. [Revista electrónica]. https://doi.org/10.6084/m9.figshare.5900227.v1
Referencias
G. Pérez Reyes y A. Martínez Rodríguez, La Ciencia como empresa social: su evaluación desde la bibliometría. Biblios [Revista electrónica]. No. 55, pp. 27-39., 2014. DOI: https://doi.org/10.5195/biblios.2014.157.
R. Sancho, Indicadores bibliométricos utilizados en la evaluación de la ciencia y la tecnología. Revisión bibliográfica. Revista española de documentación científica [Revista electrónica]. Vol. 13. Núm. (3-4), pp. 842-865., 1990. Disponible en: https://digital.csic.es/handle/10261/23694
A. Castillo y M. Carretón, Investigación en comunicación: estudio bibliométrico de las revistas de comunicación en España. Comunicación y Sociedad [Revista electrónica]. Vol. XXIII, Núm. (2), pp. 289-327., 2010. Disponible en:
http://hdl.handle.net/10045/22678.
V. Tomás Górriz y V. Tomás-Casterá, La Bibliometría en la evaluación de la actividad científica. Hosp Domic [Revista electrónica]. Vol. 2 Núm. (4), pp. 145-63., 2018. DOI: http://doi.org/10.22585/hospdomic.v2i4.51
E. Spinak, Indicadores Cienciométricos. Ciência da informação [Revista electrónica]. Vol. 27 Núm. (2), pp. 141-148., 1998. Disponible en: http://revista.ibict.br/ciinf/article/view/795
J. Amézquita López, D. Martínez Torres, J. Martínez Torres y F. Maza Ávila. Bibliometría, infometría y cienciometría. Proyecto de investigación: Diseño e implementación de la catedra CTS+ I (Ciencia, Tecnología, Sociedad e Innovación) en la Universidad de Cartagena. Cartagena: Ediciones Unicartagena, 2011.
Y. Pérez Guadarramas, A. Rodríguez Blanco, A. Simón Cuevas, W. Hojas-Mazo, y J. Olivas, Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos. Procesamiento del Lenguaje Natural [Revista electrónica]. Núm. 59, pp. 39-46., 2017. Disponible en: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5491
E. Sanz y C. Martin, Técnicas Bibliométricas aplicadas a los estudios de usuarios. Revista General de Información y Documentación [Revista electrónica]. Vol. 7 Núm. (2), pp. 42-64., 1997. Disponible en: https://revistas.ucm.es/index.php/RGID/article/view/RGID9797220041A
M. Peralta, M. Frías y O. Chaviano, Criterios, clasificaciones y tendencias de los indicadores bibliométricos en la evaluación de la ciencia. Revista Cubana de Información en Ciencias de la Salud [Revista electrónica]. Vol. 26 Núm. (3), pp. 290-309, 2015. Disponible en: http://www.redalyc.org/articulo.oa?id=377645762009.
B. Velasco, J. Eiros, J. Pinilla y J. San Román, La utilización de los indicadores bibliométricos para evaluar la actividad investigadora, Aula Abierta, [Revista electrónica]. Vol. 40 Núm. (2), pp. 75-84., 2012. Disponible en: https://dialnet.unirioja.es/servlet/articulo?codigo=3920967
R. Ruiz y R. Bailón, El método de las palabras asociadas (I): La estructura de las redes científicas. Boletín de la Asociación de la Revista Andaluza de Bibliotecarios [Revista electrónica]. Vol. 14 Núm. (53), pp. 43-60, 1998. Disponible en: http://eprints.rclis.org/13003/
C. Gálvez, Análisis de co-palabras aplicado a los artículos muy citados en Biblioteconomía y Ciencias de la Información (2007-2017). Transinformação, v30(3), 277-286., 2018. http://dx.doi.org/10.1590/2318-08892018000300001
D. Swanson, “Complementary structures in disjoint science literatures.” Presented in Proceedings of the 14th Annual International ACM/SIGIR Conference. University of Chicago, September 1991. DOI: https://dl.acm.org/doi/10.1145/122860.122889
M. Hearst, “Untangling text data mining.” Presented in Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics. Association for Computational Linguistics, University of California, June 1999. https://aclanthology.org/P99-1001.pdf
D. Sullivan, Document warehousing and text mining. New York: Wiley Computer Publishing, 2001.
R. Feldman, J. Sanger, The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Pres, 2007.
Rochina, P. (25 abril, 2017). ¿Qué es y cuáles son las aplicaciones del Text Mining? Revista digital INESEM [Blog personal]. Disponible en: https://revistadigital.inesem.es/informatica-y-tics/text-mining/
E. Brun, y Senso, J, Minería textual. El Profesional de la Información [Revista electrónica]. Vol. 13 Núm. (1), pp. 11–27., 2004. Disponible en: http://eprints.rclis.org/11491/1/Artmineriapdf.pdf
S. Ravikumar, A. Agrahari, y Y. Singh, Mapping the intellectual structure of scientometrics: A co-word analysis of the journal Scientometrics (2005–2010). Scientometrics [Revista electrónica]. Vol. 102 Núm. (1), pp. 929-955., 2015. https://doi.org/10.1007/s11192-014-1402-8
B. Contreras, Minería de texto en la clasificación de material bibliográfico. Biblios, [Revista electrónica]. Núm. (64)., 2016. Disponible en: http://biblios.pitt.edu/ojs/index.php/biblios/article/view/309
D. De Filippo, y L. Levin, Detección y análisis de “clúster bibliográfico” en las publicaciones de Iberoamérica sobre ciencia, tecnología y sociedad (1970-2013), Investigación Bibliotecológica, [Revista electrónica]. (número especial), pp. 123-148., 2017. Disponible en: http://rev-ib.unam.mx/ib/index.php/ib/article/view/57888/51919
A. Valero. “Técnicas estadísticas en Minería de texto” (Tesis de grado). Dpto de Estadística e Investigación Operativa, Universidad de Sevilla, Sevilla, España. 2017. Disponible en: https://idus.us.es/handle/11441/63197
M. Pérez, y C. Cardoso, Minería de texto para la categorización automática de documentos, Cuadernos de la Facultad, [Revista electrónica]. Núm. (5), pp. 11-45., 2010. Disponible en: https://www.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p11-alicia-articulo-cuadernos-formateado.pdf
D. Murillo y D. Saavedra. “Implementación de algoritmo en el Lenguaje R para extraer los datos de los Perfiles en Google Scholar utilizando la técnica web Scraping de Minería de datos”. Trabajo presentado en el X Congreso de Computación para el Desarrollo, COMPDES [En línea]. 2017. https://ridda2.utp.ac.pa/bitstream/handle/123456789/3105/vipe-algoritmo-google-scholar.pdf?
sequence=1&isAllowed=y
M. Bordons y M. Zulueta, Evaluación de la actividad científica a través de indicadores bibliométricos. Revista Española de Cardiología, [Revista electrónica]. Vol. 52. Núm. (19), pp. 790-800., 1999. https://doi.org/10.1016/S0300-8932(99)75008-6
F. Ruiz, Estudio Bibliométrico sobre la Producción Científica en la UCLM. España: Departamento de Tecnologías y Sistemas de Información, Universidad de Castilla-La Mancha., 2012. Disponible en: http://alarcos.inf-cr.uclm. es/per/fruiz/wos-uclm/
U. Fayyad, G. Piatetsky-Shapiro y P. Smyth, Knowledge Discovery and Data Mining: Towards a Unifying Framework. KDD-96 Proceedings, [Revista electrónica]. pp. 82-88. https://www.aaai.org/Papers/KDD/1996/KDD96-014.pdf
L. Lebart, A. Salem y M. Bécue, Análisis estadístico de datos y textos. España: Milenio, 2000.
M. Páramo, Significados de adolescencia y psicoterapia: análisis lexicométrico de discursos grupales. Acta Colombiana de Psicología, [Revista electrónica]. Vol. 13 Núm. (2)., 2010. Disponible en: https://actacolombianapsicologia.ucatolica.edu.co/article/view/377
D. Hernández. “BiblioMineR: una herramienta estadística para la revisión bibliográfica” (Tesis de Maestría). Universidad Politécnica de Catalunya, Barcelona, España, 2012. http://hdl.handle.net/2099.1/16500
B. Lee y Y. Jeong, Mapping Korea's national R&D domain of robot technology by using the co-word analysis. Scientometrics, [Revista electrónica]. Vol. 77 Núm. (1), 3-19., 2008. https://doi.org/10.1007/s11192-007-1819-4
R. Caraguay. “Aplicación de técnicas de minería de texto para el agrupamiento de componentes académicos en base a los contenidos de planes docentes”. (Trabajo de pregrado). Universidad Técnica Particular de Loja, Ecuador, 2016.
P. Murphy, Basic Text Mining in R. [Online]. 2017. Disponible en : https://rpubs.com/pjmurphy/265713
M. Bécue Bertaut. Mesurem els mots ? L ' anàlisi estadística de textos. En A. Ventura (Presidencia), I Jornades de Llengua i Estadística. Ponencia llevada a cabo en la de Lengua- Estadística de l'Idescat, Barcelona, España, 2009.
M. Vallez, y R. Pedraza Jiménez, El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines. Hipertext.net, [Revista electrónica]. Núm. 5, 2007. Disponible en: https://www.upf.edu/hipertextnet/numero-5/pln.html
G. Salton, “Automatic text processing: the transformation, analysis, and retrieval of information by computer.” Boston: Addison-Wesley Longman Publishing Co, 1989.
L. Oliva, M. Hernández, y C. Castro, Más que palabras nos dicen los adolescentes que desean migrar. Estudio estadístico de las respuestas a una pregunta. Revista de Psicología Social Aplicada, [Revista electrónica], Vol. 1 Núm. (1), pp. 55–73., 2012. Disponible en: https://revistas.innovacionumh.es/index.php/lexmercatoria/article/view/892
A. Jain, M. Murty, y P. Flynn, Data clustering: a review. ACM computing surveys (CSUR), [Revista electrónica], Vol. 31 Núm. (3), pp. 264-323, 1999. Disponible en: https://dl.acm.org/doi/10.1145/331499.331504
F. Wickelmaier, “An Introduction to MDS.” Dinamarca: Aalborg University, 2003.
I. Romero-Pérez, Y. Alarcón-Vásquez, y J. García-Jiménez, Lexicométrica: Enfoque aplicado a la redefinición de conceptos e identificación de unidades temáticas. Biblios, [Revista electrónica] Núm. 71., 2018. Disponible en: http://biblios.pitt.edu/ojs/index.php/biblios/article/view/466/0
I. Romero-Pérez, y E. Latorre-Iglesias, Listado de documentos seleccionados para el análisis y visualización de las tendencias y dinámicas de producción del grupo de investigación Joaquín Aaron Manjarrés (2011-2017)., 2018. Figshare. Journal contribution. [Revista electrónica]. https://doi.org/10.6084/m9.figshare.5900227.v1