Detección de ciberacoso en español mediante procesamiento de lenguaje natural y aprendizaje automático

Autores/as

DOI:

https://doi.org/10.17081/invinno.13.2.7922

Palabras clave:

Aprendizaje automático, Ciberacoso, Procesamiento de lenguaje natural, Redes neuronales, Red social X

Resumen

Objetivo: Detectar el ciberacoso en línea aplicando un enfoque interseccional mediante el uso de procesamiento de lenguaje natural (PLN) y técnicas de aprendizaje automático, específicamente dirigidas al idioma español en la red social X (anteriormente Twitter). El estudio se centra en incorporar factores interseccionales como género, raza, etnia y orientación sexual para identificar instancias de ciberacoso.
Metodología: El proceso comenzó con la identificación de palabras clave relevantes para detectar el ciberacoso, guiado por investigaciones previas sobre los patrones lingüísticos asociados con el acoso en línea. Estas palabras clave se utilizaron para recopilar tweets, resultando en un conjunto de datos diverso que refleja diversas expresiones vinculadas al ciberacoso. Un panel de expertos anotó el conjunto de datos, categorizando los tweets como "Ciberacoso" o "No Ciberacoso," con un enfoque en la región colombiana. Posteriormente, se entrenaron tres modelos de aprendizaje automático—Naive Bayes, Máquinas de Soporte Vectorial (SVM) y Redes Neuronales—para predecir el ciberacoso.
Resultados: Naive Bayes alcanzó un área bajo la curva ROC del 89.7%, SVM llegó al 90.9%, y las Redes Neuronales registraron el mejor rendimiento con un AUC del 91%.
Conclusiones: Los resultados evidencian la efectividad de los modelos de aprendizaje automático, en particular de las Redes Neuronales, para detectar ciberacoso en español. La incorporación de un enfoque interseccional permitió comprender con mayor profundidad cómo se manifiestan estas expresiones dañinas en los entornos digitales.

Citas

[1] K. Wang, Y. Chen, J. Zhang, and B. A. Oudekerk, "Indicators of School Crime and Safety: 2019. NCES 2020-063/NCJ 254485," National Center for Education Statistics, 2020.

[2] UNICEF, "Violencia contra niños, niñas y adolescentes en América Latina y el Caribe 2015-2021," 2021. [Online]. Available: https://www.unicef.org/lac/media/29031/file/Violencia-contra-ninos-ninas-y-adolescentes-en-America-Latina-y-el-Caribe-2015-2021.pdf

[3] GLEN, "‘Being LGBT in School’A Resource for Post-primary Schools to Prevent Homophobic and Transphobic Bullying and Support LGBT Students," ed: GLEN and The Department of Education and Science Dublin, OH, 2016.

[4] Comisión Interamericana de Derechos Humanos, "Violencia contra personas lesbianas, gays, bisexuales, trans e intersex en América," 2015.

[5] J. J. Jaramillo and J. E. R. Pineda, "Padres y madres homosexuales y bisexuales en Colombia. Experiencias de discriminación y estrategias de afrontamiento," RES. Revista Española de Sociología, vol. 28, no. 1, pp. 95-112, 2019. doi: 10.22325/fes/res.2018.62.

[6] Asamblea Mundial de la Salud, 69. (‎2016)‎. Plan de acción mundial de la OMS para fortalecer la función del sistema de salud en el marco de una respuesta nacional multisectorial para abordar la violencia interpersonal, en particular contra las mujeres y las niñas, y contra los niños en general. Organización Mundial de la Salud. https://iris.who.int/handle/10665/253191.

[7] N. CEPAL, "Enfrentar la violencia contra las mujeres y las niñas durante y después de la pandemia de COVID-19 requiere FINANCIAMIENTO, RESPUESTA, PREVENCIÓN Y RECOPILACIÓN DE DATOS," 2020.

[8] Instituto Nacional de Medicina Legal y Ciencias Forenses, "Forensis, Datos para la vida. Número 1. ISSN 2145-0250," Bogotá, D.C. República de Colombia, vol. 23, 2021.

[9] N. Gherardi, "Otras formas de violencia contra las mujeres que reconocer, nombrar y visibilizar," 2016.

[10] K. Barker and O. Jurasz, "Online violence against women as an obstacle to gender equality: A critical view from Europe," European Equality Law Review, vol. 2020, no. 1, pp. 47-60, 2020.

[11] N. Giant, Ciberseguridad para la i-generación: Usos y riesgos de las redes sociales y sus aplicaciones. Narcea Ediciones, 2016.

[12] S. L. Price, "Differences in School Discipline Efforts and Cyberbullying by School Level: A National Analysis," Sam Houston State University, 2021.

[13] J. van Tiel, "Cyberbullying, an overlooked and ever growing danger to the development of children," Technical report, KidsRights, 2020.

[14] ONU Mujeres, "Frequently Asked Questions: Types of Violence against Women and Girls," 2021.

[15] U. Interparlamentaria, "Sexismo, acoso y violencia contra las mujeres parlamentarias," Issues Brief octubre, 2016.

[16] G. Mura and D. Diamantini, "Cyberbullying among Colombian students: An exploratory investigation," European Journal of investigation in health, Psychology and Education, vol. 3, no. 3, pp. 249-256, 2013. doi:10.3390/ejihpe3030022.

[17] ONG Internacional Bullying Sin Fronteras para América, Asia, Oceanía y África, "Estadísticas Mundiales de Bullying 2023. Colombia Noveno lugar. 41.500 casos." [Online]. Available: https://bullyingsinfronteras.blogspot.com/2018/11/estadisticas-de-bullying-en-colombia.html

[18] L. M. Munar, A. A. R. Diaz, and R. d. J. R. García, "Violencia de género en línea en Colombia: desafíos y acciones para un entorno digital seguro," Informática y Derecho. Revista Iberoamericana de Derecho Informático (2. ª época), no. 14, pp. 59-71, 2023.

[19] Colombia Diversa, "La violencia no nos impide ser y amar," Informe: Situación de Derechos Humanos de personas LGBT, 2021.

[20] Comisión Interamericana de Derechos Humanos, "Derechos económicos, sociales, culturales y ambientales de personas afrodescendientes," 2021. [Online]. Available: http://www.oas.org/es/cidh/informes/pdfs/DESCA-Afro-es.pdf

[21] J. Martínez-Santiago, I. Zych, and A. J. Rodríguez-Hidalgo, "Bullying personal y étnico-cultural en la Amazonía peruana: prevalencia, solapamiento y predictores," Revista de Psicodidáctica, vol. 28, no. 2, pp. 153-163, 2023. https://doi.org/10.1016/j.psicod.2023.05.003.

[22] M. M. Islam, M. A. Uddin, L. Islam, A. Akter, S. Sharmin, and U. K. Acharjee, "Cyberbullying detection on social networks using machine learning approaches," in 2020 IEEE Asia-Pacific Conference on Computer Science and Data Engineering (CSDE), 2020, pp. 1-6. doi:10.1109/CSDE50874.2020.9411601

[23] J. Lu et al., "Hate speech detection via dual contrastive learning," IEEE/ACM Trans. Audio Speech Lang. Process., vol 31, pp. 2787-2795, 2023. doi: 10.48550/arXiv.2307.05578.

[24] T. Kanan et al., "An Intelligent Health Care System for Detecting Drug Abuse in Social Media Platforms Based on Low Resource Language," IEEE/ACM Trans. Audio Speech Lang. Process., vol 32, pp. 691-703 2023. doi:10.1109/TASLP.2023.3294699.

[25] D. Maynard and A. Funk, "Automatic detection of political opinions in tweets," in The Semantic Web: ESWC 2011 Workshops: ESWC 2011 Workshops, Heraklion, Greece, May 29-30, 2011, Revised Selected Papers 8, 2012: Springer, pp. 88-99. doi:10.1007/978-3-642-25953-1_8.

[26] M. Müller, M. Salathé, and P. E. Kummervold, "Covid-twitter-bert: A natural language processing model to analyse covid-19 content on twitter," Frontiers in artificial intelligence, vol. 6, p. 1023281, 2023. https://doi.org/10.48550/arXiv.2005.07503.

[27] Ç. Acı, E. Çürük, and E. S. Eşsiz, "Automatic detection of cyberbullying in formspring. me, myspace and Youtube social networks," Turkish Journal of Engineering, vol. 3, no. 4, pp. 168-178, 2019. https://doi.org/10.31127/tuje.554417.

[28] H. Kwak, J. Blackburn, and S. Han, "Exploring cyberbullying and other toxic behavior in team competition online games," in Proceedings of the 33rd annual ACM conference on human factors in computing systems, 2015, pp. 3739-3748. https://doi.org/10.1145/2702123.2702529.

[29] A. López-Martínez, J. A. García-Díaz, R. Valencia-García, and A. Ruiz-Martínez, "CyberDect. A novel approach for cyberbullying detection on twitter," in Technologies and Innovation: 5th International Conference, CITI 2019, Guayaquil, Ecuador, December 2–5, 2019, Proceedings 5, 2019: Springer, pp. 109-121. https://doi.org/10.1007/978-3-030-34989-9_9.

[30] G. A. León-Paredes et al., "Presumptive detection of cyberbullying on twitter through natural language processing and machine learning in the Spanish language," in 2019 IEEE CHILEAN Conference on Electrical, Electronics Engineering, Information and Communication Technologies (CHILECON), 2019: IEEE, pp. 1-7. https://doi.org/10.1109/CHILECON47746.2019.8987684.

[31] M. Rosero and L. Saavedra, "Estudio comparativo de la creación léxica en estudiantes de la Universidad del Valle en Santiago de Cali y Cartago para referirse a las mujeres en el ámbito sexual y cultural". Tesis. Licenciatura en Lenguas Extranjeras. Escuela de Ciencias del Lenguaje. Universidad del Valle. 2014.

[32] M. Moreno Mosquera, S. Reyes Mosquera, and L. Rivas Portocarrero, "Internalización de la estigmatización y la discriminación racial entre estudiantes de raza negra de la jornada diurna en la Universidad del Valle Sede Pacifico ¿endorracismo?”. Tesis. Escuela de Trabajo Social y Desarrollo Humano. Facultad de Humanidades. Universidad del Valle. 2020.

[33] M. D. Castellano Ascencio, "Análisis pragmático de la función de los tratamientos nominales en actos de habla descorteses en Medellín (Colombia)," Forma y función, vol. 30, no. 2, pp. 139-162, 2017. https://doi.org/10.15446/fyf.v30n2.65794.

[34] O. J. Cuesta-Moreno and A. Gómez-Melo, "Frases que racializan, excluyen y minimizan al sujeto en el lenguaje cotidiano de un grupo de jóvenes de Bogotá," PROSPECTIVA. Revista de Trabajo Social e intervención social, pp. 143-166, 2014. https://doi.org/10.25100/prts.v0i19.970.

[35] Powers, D. M. W. “Evaluation: From precision, recall, and F-measure to ROC, informedness, markedness & correlation.” Journal of Machine Learning Technologies, 2011, vol 2, 37–63. https://doi.org/10.48550/arXiv.2010.16061.

Descargas

Publicado

2025-10-02

Cómo citar

[1]
A. M. Agudelo Ortiz, L. S. Rodríguez Pulecio, y O. F. Bedoya Leiva, «Detección de ciberacoso en español mediante procesamiento de lenguaje natural y aprendizaje automático», Investigación e Innovación en Ingenierías, vol. 13, n.º 2, pp. 168–183, oct. 2025.