Mejoras en las herramientas ELCmapas y Complementa

Interesantes mejoras para als herramientas ELCmapas y Complementa se han puesto a disposición de los usuarios CAPFITOGEN

Tenemos buenas noticias para los usuarios de las herramientas ELCmapas y Complementa, dos de las más usadas y demandadas por los usuarios de CAPFITOGEN.

En el caso de ELC mapas, ahora es posible usar hasta seis tipos diferentes de determinación del número óptimo de grupos de manera objetiva (previamente sólo se contaba con dos métodos):

a)    kmeansbic: Un sistema simple que usa como algoritmo de agrupamiento K-means el cual se ejecuta sucesivamente incrementando el número de grupos, cuya respuesta se evalua con el criterio BIC o “bayesian information criterion” en cada proceso. Adicionalmente los datos originales son transformados mediante un análisis de componentes principales (ACP). Tiene una muy buena capacidad de análisis de grandes conjuntos de datos (países o capas de más de 800,000 km2 o celdas, respectivamente) en un tiempo razonable. No tiene problemas de reproducibilidad detectados.

b)    elbow: Agrupamiento K –means con determinación de punto de corte basado en la disminución de la suma de cuadrados intragrupo. El número de grupos óptimo es el alcanzado cuando la disminución de la sumas de cuadrados intragrupos entre una solución de n y una de n+1 grupos es menor del 50%. El método “elbow” o codo, es el de más rápido cálculo y es capaz de actuar sobre grandes cantidades de datos, por lo cual se aconseja para países de gran tamaño. Sin embargo tenga presente que este método puede tener problemas de reproducibilidad (diferente número de categorías entre procesos con idénticos conjuntos de variables).

c)    medoides: Método de agrupamiento de partición alrededor de los medoides (pam). Se utiliza el método de silhouette de interpretación y validación del número de grupos, permitiendo determinar qué tan apropiadamente han sido los datos agrupados. Es un sistema que consume más recursos del PC, por lo que aplicado a grandes conjuntos de datos, consumirá más tiempo o incluso puede hacer que el software colapse.

d)    calinski: Utilización del criterio Calinski-Harabasz para seleccionar el número óptimo de grupos a partir de la generación de agrupamientos en cascada por Kmeans. Al igual que medoides, la determinación del número óptimo de grupos y la asignación de grupo a cada celda puede consumir bastante tiempo cuando se trata de áreas de trabajo grandes (se generan errores de memoria al usarse en capas de más de 800,000 celdas, por ejemplo, áreas/países mayores a 800,000 km2 a una resolución de 1×1).

e)    ssi: Criterio ssi o “simple structure index”  para seleccionar el número óptimo de grupos a partir de la generación de agrupamientos en cascada por Kmeans. Al igual que medoides, la determinación del número óptimo de grupos y la asignación de grupo a cada celda puede consumir bastante tiempo cuando se trata de áreas de trabajo grandes (se generan errores de memoria al usarse en capas de más de 800,000 celdas, por ejemplo, áreas/países mayores a 800,000 km2 a una resolución de 1×1).

f) bic: Determinación del número óptimo de grupos por el criterio BIC para modelos gausianos mixtos parametrizados inicializados por un método de agrupamientos jerárquico basado en modelos.  Este método es muy demandante de memoria, por lo que no se recomienda usar para áreas de trabajo de más de 50,000 km2 con resolución de celda 1×1 km o más de 350,000 km2 con una resolución de celda 5×5 km.

Respecto a Complementa, las mejoras consisten en dos aspectos importantes respecto a los datos a ingresar por el usuario y a la exactitud de los resultados, particularmente para los análisis de cobertura.

Respecto a los datos a ingresar, si el usuario desea trabajar con la asociación taxa-categoría ecogeográfica para realizar los análisis de representatividad, previamente debía utilizar la herramienta Representa para extraer las categorías ELC para cada sitio de presencia. Esto ya no es necesario dado que ahora Complementa es capaz de extraer la categoría del mapa ELC (previamente alojado en la carpeta “ELCmapas”) para las presencias de una tabla de pasaporte que ni siquiera requiere contener la columna “BG_ELC”, aspecto que anteriormente era obligatorio.

Finalmente, Complementa ahora está dotada de un método de exclusión de duplicados espaciales (sitios de presencia suficientemente cercanos como para ser considerados la misma población) dentro de cada taxon (o unidad taxa-categorías ELC), el cual es particularmente útil para los análisis de cobertura, permitiendo evitar sobre-estimaciones del grado de conservación de especies en redes de áreas protegidas.

Estás mejoras están incluidas en la más reciente actualización del instalador de las herramientas CAPFITOGEN (instrucciones de descarga) y vienen explicadas en la última versión del manual de usuario (ver/descargar).

Deje un comentario

Su email no será publicado.

*


*


English