Sciweavers

IPPS
2009
IEEE

Early experiences with large-scale Cray XMT systems

14 years 6 months ago
Early experiences with large-scale Cray XMT systems
  Several 64‐processor XMT systems have now been shipped to  customers and there have been 128‐processor, 256‐processor and 512‐ processor systems tested in Cray’s development lab. We describe some  techniques we have used for tuning performance in hopes that  applications continued to scale on these larger systems. We discuss  how the programmer must work with the XMT compiler to extract  maximum parallelism and performance, especially from multiply  nested loops, and how the performance tools provide vital information  about whether or how the compiler has parallelized loops and where  performance bottlenecks may be occurring. We also show data that  indicate that the maximum performance of a given application on a  given size XMT system is limited by memory or network bandwidth, in  a way that is somewhat independent of the number of processors...
David Mizell, Kristyn J. Maschhoff
Added 24 May 2010
Updated 24 May 2010
Type Conference
Year 2009
Where IPPS
Authors David Mizell, Kristyn J. Maschhoff
Comments (0)