hpclogo

LogoBlanco2

Preguntas frecuentes

En esta sección se han seleccionado ciertas preguntas en las que los usuarios usualmente tienen dudas. Por favor si tiene alguna inquietud nueva, enviarla a soportehpc@uniandes.edu.co

Igualmente, los usuarios deberián leer esta sección para examinar si su inquietud ya fue respondida. 

Preguntas en relación a almacenamiento

¿Puedo guardar mis archivos en mi carpeta personal?

Si podría pero se le recomienda a los usuarios organizar sus archivos dependiendo de los propositos de cada archivo. Por ejemplo, si tiene muchos archivos de entrada para un programa, es aconsejable hacer una carpeta denominada DATA, pues de esa forma hay una forma ordenada de acceder a la información. 

¿Cuál es el almacenamiento total del cluster?

El cluster tiene 116TB de almacenamiento compartido.

¿Cual es la historia de la computación de alto desempeño en la Universidad de los Andes?

El almacenamiento de los nodos de cómputo se explican en el siguiente link

¿Cuál es la mejor manera de transferir una gran cantidad de datos en un clúster?

Se puede sincronizar una gran cantidad de datos desde un computador local al cluster usando el comando rsync o scp -r

¿Hay alguna manera de conectar los archivos de mi maquina local a uno de los clústers?

Usando el comando rsync como se explica en la guia de cluster

Preguntas en relación a Envio de Trabajos

He utilizado el comando de ver módulos, pero todavía no puedo encontrar la aplicación que estoy tratando de usar

Si luego de hacer module avail y no se encuentra la aplicación/programa que requiere, debe comunicarse con soportehpc@uniandes.edu.co e indicar la instalación del software correspondiente.

Pongo mis archivos en mi carpeta personal pero me parece que mi trabajo no se ejecuta

Debe tener en cuenta que el PATH de los archivos de entrada de su script sea el correspondiente al que se escribe en el trabajo de ejecución como en el siguiente link.

¿Puedo cambiar el script de trabajo después de que se ha enviado?

Se puede usar el comando qalter, luego de que un trabajo alla sido sometido. Explicación uso de qalter

¿En que lugar el archivo de salida estándar (stdout) termina cuando un trabajo es ejecutado?

La salida estandar (STDOUT) es rediregida por defecto al node y luego transferida cuando el job finaliza. Sin embargo, si se esta generando nueva DATA, el STDOUT debe ser dirigido a una nueva ubicación.

¿Cómo puedo averiguar cuáles son las necesidades de recursos computacionales que mi trabajo necesita?

Una forma de averiguar los recursos que su trabajo necesita es enviarlo con una capacidad de memoria intermedia (ej. 2GB), un numero de nodos intermedio (eje. 2 nodos) y un numero de procesadores por nodo (eje. 2). Luego, se especifica que las opciones #PBS -M <email> y #PBS -m ae para que se reciba a un correo el resumen del uso de recursos. Al tener, estos resultados se puede saber cuantos recursos se usaron y asi enviar un nuevo job de acuerdo a estas condiciones.  

¿Cuántos cores debería solicitar?

El número de cores a solicitar va a depender del programa(s) que se usen en el job, por lo cual es importante leer la documentacion de los programas aplicados.

¿Puedo causar problemas a otros usuarios si solicito demasiados recursos o cometo un error con mi script de trabajo?

Luego de la ultima actualización del cluster, los usuarios no pueden causar problemas a otros usuarios si se solicita demasiados recursos. Sin embargo, es deseable que los usuarios entiendan cuanto recursos necesita su job y no pedir exageradamente mas de lo necesario, pues seria un malgasto de recursos

¿Cómo puedo ver exactamente qué recursos (E / S, la CPU, la memoria y el cero) mi trabajo está utilizando actualmente?

Se puede usar el comando top -id <jobid> como se indica en la guia del cluster.

¿Cuál es la diferencia entre la memoria virtual (VMEM) y la memoria física (MEM)

Hay tres tipos de memoria: i) La memoria fisica (MEM) es la memoria que reside en las tarjetas de memoria del servidor, ii) La memoria swap es el almacenamiento que se encuentra en el disco y por ultimo, la memoria virtual (VMEM) es un espacio donde se combina la memoria fisica y swap.

No obstante, es recomendable no usar mas memoria de la que se encuentra disponible fisicamente porque esto puede disminuir el rendimiento. 

¿Cómo elijo la versión de software que utilizo?

Al usar el comando module avail, se puede ver los diferentes versiones de un software. Por lo cual, se puede usar el comando module load <sofware/version> para subir la version en cuestión. Luego, se puede verficar la version cargada con el comando module list