Extracción automática de taxonomía para una revista científica.

Fecha
2023-09-20
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Guayaquil. Facultad de Ingeniería Industrial. Carrera de Ingeniería en Sistemas de Información.
Resumen
El presente trabajo de titulación propone un algoritmo de extracción automática de taxonomía que ayude a la identificación, organización y etiquetado de información en los artículos publicados en una revista científica. El cual permitirá de manera más eficiente y precisa la extracción de términos claves, permitiendo comprender la información en diversos campos. A través de la implementación de este algoritmo, se procura otorgar a los autores de artículos científicos un reconocimiento más notable de sus obras, desempeñando así un papel fundamental en el desarrollo profesional de los autores. El sistema implementa una extracción de dato al momento que el usuario ingrese el articulo científico al sistema de tal manera empezará un proceso de organización y visualización de tópicos, facilitando el análisis y comprensión por parte del usuario. Durante el proceso de elaboración del algoritmo, se seleccionó el lenguaje de programación Python y se integraron librerías como pandas, matplotlib, sklearn, spacy y el modelo discriminante LDA con el fin de extraer los términos claves para ser visualizadas. Para concluir, el trabajo de titulación fue finalizado en el tiempo acordado para la elaboración del algoritmo, alcanzando los objetivos establecidos y obteniendo los resultados previstos.
The present work proposes an automatic taxonomy extraction algorithm to help the identification, organization and labeling of information in articles published in a scientific journal. This algorithm will allow a more efficient and accurate extraction of key terms, allowing to understand the information in different fields. Through the implementation of this algorithm, the authors of scientific articles will be granted a more notable recognition of their works, thus playing a fundamental role in the professional development of the authors. The system implements a data extraction at the moment the user enters the scientific article into the system in such a way that a process of organization and visualization of topics will begin, facilitating the analysis and understanding by the user. During the algorithm development process, the Python programming language was selected and libraries such as pandas, matplotlib, sklearn, spacy and the LDA discriminant model were integrated in order to extract the key terms to be visualized. To conclude, the degree work was completed within the agreed time for the development of the algorithm, achieving the established objectives and obtaining the expected results.
Descripción
Este documento contiene archivo en PDF.
Palabras clave
CIENCIAS BÁSICAS, BIOCONOCIMIENTO Y DESARROLLO INDUSTRIAL, APRENDIZAJE AUTOMÁTICO, PYTHON, MATPLOTLIB
Citación