Minería de texto como una herramienta para la búsqueda de artículos científicos para la investigación
Contenido principal de artículos
Palabras clave:
Minería de texto, Minería de datos, Estructura de datos
Resumen
RESUMEN
Por medio de la extracción de datos tanto precisos como no relevantes sobre un texto o estructura de datos textual, se es posible generar nueva información y conocimiento, este análisis es realizado con la minería de texto. Si bien esta práctica puede conducir más apropiadamente hacia la generación y/o descubrimiento de nuevos datos, también es viable para la verificación y elaboración de datos a referenciar. Ya que su uso yace en el análisis de la información arrojando datos de manera indiscriminada, esto resulta útil a la hora de rectificar la compatibilidad de la información, entre dos o más medios de contenido textual. Se expondrán y explicarán las diversas maneras como a través de la minería de texto, ayuda en la elaboración de un artículo de investigación o un estado del arte, teniendo en cuenta el tópico a explicar en dicho texto, se utilizarán diferentes metodologías para implementar la minería de texto con el fin de analizar otros diferentes artículos potenciales referencias, teniendo así, un mejor enfoque sobre el material cimiento de un nuevo proyecto o artículo. Adicional a esto se mostraran pruebas realizadas en la herramienta de software Weka donde se evidencian los resultados que arroja el software de los artículos que se analizan por medio de este.
ABSTRACT
By removing both accurate as irrelevant on a text or textual data structure, data is possible to generate new information and knowledge, this analysis is performed with text mining. While this practice can lead to more appropriately the generation and/or discovery of new data, it is also viable for verification and processing of reference data. Since its use lies in the analysis of information indiscriminately throwing data, this is useful when rectifying the compatibility of information between two or more modes of textual content. Will be presented and explained the various ways through text mining helps in the development of a research paper or a state of the art, given the topic to explain in this text, different methodologies are used to implement mining text in order to analyze potential references other than items, thus having a better approach to the material foundation of a new project or item. In addition to this testing in software Weka tool where translations of the software items are analyzed by this it is evident be shown.
Citas
[2] R. Lau, S. Liao, R. Kwok, K. Xu, Y. Xia and Y. Li, 'Text mining and probabilistic language modeling for online review spam detection', ACM Trans. Manage. Inf. Syst., Vol. 2. No. 4. pp. 1-30, 2011.
[3] Support.sas.com, 'SAS Text Miner', 2015. [Online]. Available: http://support.sas.com/software/products/txtminer/#s1=1. [Accessed: 17- Nov- 2015].
[4] S. Surveys, 'IBM - SPSS Text Analytics for Surveys', Www-03.ibm.com, 2015. [Online]. Available: http://www-03.ibm.com/software/products/en/spss-text-analytics-surveys. [Accessed: 17- Nov- 2015].
[5] M. Dikaiakos, A. Katsifodimos and G. Pallis, 'Minersoft', TOIT, vol. 12, no. 1, pp. 1-34, 2012.
[6] S. VijayGaikwad, A. Chaugule and P. Patil, 'Text Mining Methods and Techniques', International Journal of Computer Applications, vol. 85, no. 17, pp. 42-45, 2014.
[7] R. Lau, S. Liao, R. Kwok, K. Xu, Y. Xia and Y. Li, 'Text mining and probabilistic language modeling for online review spam detection', ACM Trans. Manage. Inf. Syst., vol. 2, no. 4, pp. 1-30, 2011.
[8] R. Chau and C. Yeh, 'A multilingual text mining approach to web cross-lingual text retrieval', Knowledge-Based Systems, vol. 17, no. 5-6, pp. 219-227, 2004.
[9] X. Xiao, H. Xu and S. Xu, 'Using IBM SPSS modeler to improve undergraduate mathematical modelling competence', Comput Appl Eng Educ, vol. 23, no. 4, pp. 603-609, 2015.
[10] V. Reitano, 'Book Review: Review of SAS Enterprise Miner Textbooks', Social Science Computer Review, vol. 33, no. 3, pp. 415-417, 2014.
[11] C. Aggarwal, 'Mining text and social streams', SIGKDD Explor. Newsl., vol. 15, no. 2, pp. 9-19, 2014.
[12] M. Wauer, J. Meinecke, D. Schuster, A. Konzag, M. Aleksy and T. Riedel, 'Semantic Federation of Product Information from Structured and Unstructured Sources', International Journal of Business Data Communications and Networking, vol. 7, no. 2, pp. 69-97, 2011.
[13] C. P. Sumathi and N. Priya, 'Analysis of an Automatic Text Content Extraction Approach in Noisy Video Images', International Journal of Computer Applications, vol. 69, no. 4, pp. 6-13, 2013.
[14] D. Fagan, 'Emily Dickinson's Unutterable Word', The Emily Dickinson Journal, vol. 14, no. 2, pp. 70-75, 2005.
[15] A. Hassan, A. Abu-Jbara, W. Lu and D. Radev, 'A Random Walk “Based Model for Identifying Semantic Orientation', Computational Linguistics. Vol. 40. No. 3. pp. 539-562. 2014.
[16] A. Neet and H. Singh, 'Web Data Mining: Survey', IJETT, vol. 10, no. 3, pp. 144-147, 2014.
[17] K. Felizardo, G. Andery, F. Paulovich, R. Minghim and J. Maldonado, 'A visual analysis approach to validate the selection review of primary studies in systematic reviews', Information and Software Technology. Vol. 54. No. 10. pp. 1079-1091, 2012.
[18] B. Londoño González and P. Sánchez, "Algoritmo Novedoso Para la Detección de Tareas Repetitivas en el Teclado", Investigacion e Innovación en Ingenierias, vol. 3, no. 2, 2015. DOI: 10.17081/invinno.3.2.2031
[19] M. Jimeno, Y. De la Hoz and J. Wilches, "Wireless ECG and PCG Portable Telemedicine Kit for Rural Areas of Colombia", Investigación e Innovación en Ingenierías, vol. 2, no. 2, 2014.DOI: 10.17081/invinno.2.2.2044