Análisis de algoritmos de Clustering basados en particionamiento y basados en Densidad para el procesamiento de trayectorias GPS.

No hay miniatura disponible
Fecha
2020-10-08
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Guayaquil. Facultad de Ciencias Matemáticas y Físicas. Carrera de Ingeniería en Sistemas Computacionales.
Resumen
Los constantes avances en técnicas de registro y recolección de información de trayectorias GPS, el incremento en la cantidad de dispositivos que recolectan este tipo de información como las cámaras de video, sensores de tráfico, teléfonos inteligentes, etc, origina un gran volumen de información. El poder identificar patrones realizando un análisis inteligente de estos datos es un área en dónde hoy muchos investigadores realizan esfuerzos para identificar soluciones. Las técnicas de agrupamiento de trayectorias GPS permiten identificar patrones sobre grandes volúmenes de datos. Esta tesis presenta una evaluación de dos de los algoritmos de clustering tradicionales Kmeans y DBscan que fueron adaptados para el procesamiento de trayectorias GPS, incorporando una segmentación de las trayectorias basada en ángulo y una selección de centroides iniciales 4k, 8k y 12 k. Los resultados obtenidos luego de aplicar el método propuesto sobre tres bases de datos de trayectorias reales son satisfactorios y muestran una mejor calidad de agrupamiento al comparar los índice Silhouette y Distancia Promedio al Individuo más cercano.
The constant advances in techniques for recording and collecting information on GPS tracks, the increase in the number of devices that collect this type of information such as video cameras, traffic sensors, smartphones, etc., originates a large volume of information. Being able to identify patterns by performing an intelligent analysis of this data is an area where today many researchers make efforts to identify solutions. GPS track clustering techniques allow patterns to be identified over large volumes of data. This thesis presents an evaluation of two of the traditional clustering algorithms Kmeans and DBscan that were adapted for the processing of GPS trajectories, incorporating a segmentation of the trajectories based on angle and a selection of initial centroids 4k, 8k and 12 k. The results obtained after applying the proposed method on three databases of real trajectories are satisfactory and show a better quality of grouping when comparing the Silhouette and Average Distance indices to the closest individual.
Descripción
PDF
Palabras clave
Métrica silhouette, K-means, DBscan, Clustering, GPS, Trayectorias, Metric silhouette, Trajectories
Citación