<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Hi Marc,<div class=""><br class=""></div><div class="">attached are scaling plots (parallel efficiency and realtime versus number of tasks and number of grid points owned per task) for a domain with 500 x 330 grid points, obtained on the JURECA HPC at Research Centre Juelich (dm only, opt = -O3). For 512 tasks, the parallel efficiency is down to 60% only. “Acceptable” scaling for my purposes is up to about 256 tasks for a domain 1.8 times larger than yours. These results are obtained for one domain only, nesting might change this picture.</div><div class=""><br class=""></div><div class="">How about the I/O in your runs? Do you get better scaling when I/O is switched off? If so, you could use I/O quilting.</div><div class=""><br class=""></div><div class="">Cheers</div><div class=""><br class=""></div><div class="">Dom</div><div class=""></div></body></html>