<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=us-ascii"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>It looks like OpenMPI is not installed on all your execution machines.&nbsp; You need to install at least the libs on all machines, or on an NFS-shared location.&nbsp; Check the output of &quot;which orted&quot; on the machine that works.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>Bart<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> wrf-users-bounces@ucar.edu [mailto:wrf-users-bounces@ucar.edu] <b>On Behalf Of </b>Ahsan Ali<br><b>Sent:</b> Tuesday, May 03, 2011 1:04 AM<br><b>To:</b> users@open-mpi.org<br><b>Subject:</b> [Wrf-users] WRF Problem running in Parallel on multiple nodes(cluster)<o:p></o:p></span></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><p class=MsoNormal>Hello,<o:p></o:p></p><div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div><div><p class=MsoNormal>I am able to run WRFV3.2.1 using mpirun on multiple cores of single machine, but when I want to run it across multiple nodes in cluster using hostlist then I get error, The compute nodes are mounted with the master node during boot using NFS. I get following error. Please help.<o:p></o:p></p></div><div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div><div><div><p class=MsoNormal>[root@pmd02 em_real]# mpirun -np 10 -hostfile /home/pmdtest/hostlist ./real.exe<o:p></o:p></p></div><div><p class=MsoNormal>bash: orted: command not found<o:p></o:p></p></div><div><p class=MsoNormal>bash: orted: command not found<o:p></o:p></p></div><div><p class=MsoNormal>--------------------------------------------------------------------------<o:p></o:p></p></div><div><p class=MsoNormal>A daemon (pid 22006) died unexpectedly with status 127 while attempting<o:p></o:p></p></div><div><p class=MsoNormal>to launch so we are aborting.<o:p></o:p></p></div><div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div><div><p class=MsoNormal>There may be more information reported by the environment (see above).<o:p></o:p></p></div><div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div><div><p class=MsoNormal>This may be because the daemon was unable to find all the needed shared<o:p></o:p></p></div><div><p class=MsoNormal>libraries on the remote node. You may set your LD_LIBRARY_PATH to have the<o:p></o:p></p></div><div><p class=MsoNormal>location of the shared libraries on the remote nodes and this will<o:p></o:p></p></div><div><p class=MsoNormal>automatically be forwarded to the remote nodes.<o:p></o:p></p></div><div><p class=MsoNormal>--------------------------------------------------------------------------<o:p></o:p></p></div><div><p class=MsoNormal>--------------------------------------------------------------------------<o:p></o:p></p></div><div><p class=MsoNormal>mpirun noticed that the job aborted, but has no info as to the process<o:p></o:p></p></div><div><p class=MsoNormal>that caused that situation.<o:p></o:p></p></div><div><p class=MsoNormal>--------------------------------------------------------------------------<o:p></o:p></p></div><div><p class=MsoNormal>mpirun: clean termination accomplished<o:p></o:p></p></div><div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div><p class=MsoNormal><br>-- <br>Syed Ahsan Ali Bokhari <br>Electronic Engineer (EE)<o:p></o:p></p><div><p class=MsoNormal><br>Research &amp; Development Division<br>Pakistan Meteorological Department H-8/4, Islamabad.<br>Phone&nbsp;#&nbsp;off &nbsp;+92518358714<o:p></o:p></p></div><div><p class=MsoNormal>Cell # +923155145014<o:p></o:p></p></div><p class=MsoNormal><o:p>&nbsp;</o:p></p></div></div>
<DIV><P><HR>
This message contains information that may be confidential, privileged or otherwise protected by law from disclosure. It is intended for the exclusive use of the Addressee(s). Unless you are the addressee or authorized agent of the addressee, you may not review, copy, distribute or disclose to anyone the message or any information contained within. If you have received this message in error, please contact the sender by electronic reply to email@environcorp.com and immediately delete all copies of the message.
</P></DIV>
</body></html>