GPU/CUDA

Graphics Processing Unit (GPU)

Deux noeuds node-04-01 et node-04-02 sont associés à des accélérateurs de calcul GPU. Voici la configuration :

Noeud INTEL 5650 avec accélerateur NVIDIA M2050
INTEL 5650NVIDIA M2050
Nombre de coeurs 6 448
Mémoire GB 12 3
Logiciel Linux CentOS 6.3

INTEL FORTRAN + MKL

NVIDIA CUDA 3.2/4.0/4.1/4.2/5.0/5.5

CUDA FORTRAN 2.3/3.1/3.2/4.0/4.1/4.2/5.0/5.5

Développer en CUDA Fortran

Pour programmer les GPU en Fortran, il est nécessaire d’utiliser le compîlateur Fortran de l’éditeur PGI. Pour ce faire, utiliser l’environnement module pour charger la version souhaitée du compilateur PGI.

Développer en CUDA C

Pour programmer les GPU en C, il est nécessaire d’utiliser le compîlateur NVCC de NVIDIA. Pour charger la version souhaitée du compilateur NVIDIA, utiliser l’environnement module.

Utiliser les exemples du SDK NVIDIA

Voici un exemple de script de soumission permettant d’utiliser le programme deviceQuery. Ce programme fait parti du SDK NVIDIA et permet d’interroger les GPU et d’avoir leurs caractéristiques.

Benchmark FFT

Nous mettons à la disposition des utilisateurs des exemples simples de calcul avec accélérateur GPU pour la FFT ND (1D, 2D et 3D). Les benchmarks FFT 1D, 2D et 3D correspondant aux tableaux ci-dessous sont également disponibles auprès des Philippe ou Georges.

Notre objecrtif est de mettre à disposition les algorithmes usuels implémentés sur GPU : FFT, Diagonalisation, Systèmes Linéaires. Nous avons commencé par la FFT où le temps de calcul croît en N*log(N). L’exemple n’est pas encore bien optimisé. Notre référence est la FFT compilé avec un compilateur INTEL FORTRAN 11, exécuté en parallèle sur 6 coeurs du processeur Intel 5650. L’exemple avec GPU utilise l’accélerateur NVIDIA M2050 et le software CUDA 3.2. Cliquez sur les liens ci-dessous où les tableaux comparent les temps de calcul pour la FFT 1D, 2D et 3D :

FFT 1D

FFT 2D

FFT 3D

Vous trouverez ici les benchmarks qui ont servi à générer ces tableaux et pour les utiliser, il suffit de se référer au fichier benchs_readme.pdf.


Documents joints

PDF - 38.6 ko
PDF - 38.6 ko
fft_bench.tgz
fft_bench.tgz
Zip - 569 octets
Zip - 569 octets

RTRA

Annonces

Stage : "Diagonalisation des matrices réelles sur GPU"

Rapport de stage de Kun SONG :

PDF - 803.4 ko
(mai - août 2013)

Jourrnées ISMO

Prséentation de la GMPCS aux journées ISMO (3, 4 et 5/04/2013)

PDF - 255.9 ko

7ème demi-journée des théoriciens de la fédération LUMAT (07/11/2012)

Optique et phénomènes non-linéaires, champs intenses et contrôle cohérent

PNG - 3.8 ko


Stage : "Optimisation du transfert de données entre un CPU et un GPU"

Rapport de stage de Jean YAOKELI :

PDF - 915.4 ko
(mai - août 2012)