Comparación de herramientas para la detección de similitudes en los sitios de preguntas y respuestas de Stack Overflow.

Fecha
2022-09
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
Resumen
La comunidad en línea Stack Overflow fue diseñada para despejar interrogantes e intercambiar conocimientos en todo lo que respecta a la tecnología y sus afines, actualmente cuenta con la participación de aficionados, profesionales y estudiantes. Al ser esta una comunidad en línea que cuenta con 5 idiomas disponibles (inglés, español, ruso, portugués y japonés) donde se alternan varias rondas de preguntas, no hay una normativa que regularice la autoría correspondiente de lo que se comente. Varios investigadores han implementado herramientas para dar fin a esta problemática, es por ello por lo que en este proyecto de titulación se realizara una investigación sistemática de las diferentes herramientas de similitudes en varios idiomas, para la elección de herramientas se realizara un análisis profundo que vaya de acorde al estudio dado por los investigadores. Una vez estudiadas cada una de las herramientas se realizar una comparativa para identificar la herramienta que mejor desempeño demuestre en la identificación de duplicidad de texto.
The Stack Overflow online community was designed to answer questions and exchange knowledge on everything related to technology and its related, currently with the participation of amateurs, professionals and students. As this is an online community that has 5 languages available (English, Spanish, Russian, Portuguese and Japanese) where several rounds of questions alternate, there is no regulation that regularizes the corresponding authorship of what is commented. Several researchers have implemented tools to put an end to this problem, which is why in this degree project a systematic investigation of the different similarity tools in several languages is carried out, for the choice of tools a deep analysis is carried out that agrees to the study given by the researchers. Once each of the tools has been studied, a comparison is made to identify the tool that demonstrates the best performance in identifying text duplication.
Descripción
PDF
Palabras clave
Stack Overflow, Duplicidad de texto, Software, Traducción Automática Neuronal, Duplicidad en varios idiomas, Text duplication, Neural Machine Translation, Multiple language duplication
Citación