Effiziente parallele Implementierung eines expliziten Euler-Verfahrens für Grafikprozessoren durch Diamant-Tiling

Efficient parallel implementation of an explicit Euler method for graphics processors by diamond tiling

Die hier vorliegende Arbeit beschäftigt sich damit, das explizite Euler-Verfahren auf Grafikprozessoren zu optimieren. Dabei werden die Speicherhierarchien, lokale Datenwiederverwendung, Ausnutzung der Speicherbandbreite der GPU und die Synchronisierung zwischen Host und Device genauer untersucht. Dabei werden zwei Implementierungen näher betrachtet, das Diamant-Tiling und das lineare Verfahren, da sie sich gut eignen um die Optimierungen genauer zu untersuchen. Es stellt sich dabei heraus, dassDie hier vorliegende Arbeit beschäftigt sich damit, das explizite Euler-Verfahren auf Grafikprozessoren zu optimieren. Dabei werden die Speicherhierarchien, lokale Datenwiederverwendung, Ausnutzung der Speicherbandbreite der GPU und die Synchronisierung zwischen Host und Device genauer untersucht. Dabei werden zwei Implementierungen näher betrachtet, das Diamant-Tiling und das lineare Verfahren, da sie sich gut eignen um die Optimierungen genauer zu untersuchen. Es stellt sich dabei heraus, dass Optimierungen wie die lokale Datenwiederverwendung und der optimale Zugriff auf den Speicher sich gegensätzlich verhalten. Ein Mischverfahren (das Waben-Tiling), dass dabei die Vorteile des linearen Verfahrens und des Diamant-Tilings vereint, führt daher zu den besten Laufzeiten.show moreshow less
The aim of the thesis is to investigate the Euler method for GPUs. The goal is to analyze the memory hierarchies, local data-reuse, memory bandwidth of the GPU and the synchronization of the host and the device. Two implemenations are considered closer the diamond tiling and the linear method, since they are well suited to investigate further improvements. It turns out that the optimizations as local data-reuse and optimum access to the memory bandwidth behave contrary. In the end a combined sysThe aim of the thesis is to investigate the Euler method for GPUs. The goal is to analyze the memory hierarchies, local data-reuse, memory bandwidth of the GPU and the synchronization of the host and the device. Two implemenations are considered closer the diamond tiling and the linear method, since they are well suited to investigate further improvements. It turns out that the optimizations as local data-reuse and optimum access to the memory bandwidth behave contrary. In the end a combined system (the honeycomb tiling) that combines the advantages of the linear method and the diamond tiling leads to the best results.show moreshow less

Download full text files

Export metadata

  • Export Bibtex
  • Export RIS
  • frontdoor_exportcitavi

Additional Services

    Share in Twitter Search Google Scholar
Metadaten
Institutes:Informatik
Author: Julien Kulbe
Year of Completion:2012
Series (Volume number)Bayreuth Reports on Parallel and Distributed Systems (3)
SWD-Keyword:Eulersches Polygonzugverfahren; Gewöhnliche Differentialgleichung; Lokalität <Informatik>; Mehrkernprozessor; Parallelverarbeitung
Tag:GPU; OpenCL
Euler method; GPU; Ordinary Differential Equation; locality; parallel processing
Dewey Decimal Classification:004 Datenverarbeitung; Informatik
CCS-Classification:G.1.7 Ordinary Differential Equations
One-step (single step) methods (REVISED)
URN:urn:nbn:de:bvb:703-opus-9756
Document Type:Master's Thesis
Language:German
Date of Publication (online):10.04.2012