Hi Jeff,<br><br>Yes, this is on Vesta. There doesn't seem to be anything in your .soft file different from mine, other than you specifying the Nov 2012 IBM compilers.<br><br>Is it possible for me to browse through the current source for the BGQ MPICH modifications?<br>
<br>Jack<br><br><div class="gmail_quote">On Fri, Mar 1, 2013 at 10:30 AM, Jeff Hammond <span dir="ltr"><<a href="mailto:jhammond@alcf.anl.gov" target="_blank">jhammond@alcf.anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
This is BGQ @ ALCF, right?  Might be MPI calls inside of Darshan.  I<br>
disable it because of issues like this.<br>
<br>
I think my ~/.soft is world-readable.  Use the @mpi-wrappers script<br>
and try to verify that you aren't getting Darshan in your build.<br>
<span class="HOEnZb"><font color="#888888"><br>
Jeff<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
On Fri, Mar 1, 2013 at 11:16 AM, Jack Poulson <<a href="mailto:jack.poulson@gmail.com">jack.poulson@gmail.com</a>> wrote:<br>
> On Thu, Feb 28, 2013 at 10:15 PM, Hal Finkel <<a href="mailto:hfinkel@anl.gov">hfinkel@anl.gov</a>> wrote:<br>
>><br>
>><br>
>> Not a problem! Thanks for being a beta tester :) I've updated the<br>
>> installed libc++ libraries to use CLOCK_REALTIME instead of CLOCK_MONOTONIC.<br>
>> Please try again.<br>
>><br>
>>  -Hal<br>
>><br>
><br>
> One more problem taken care of it seems. Unfortunately my program now<br>
> segfaults in an MPI_Gather call (and the trace still seems a bit corrupted,<br>
> see core.13). There is really only one instance in my program where<br>
> MPI_Gather is called, and it looks like this:<br>
><br>
> vector<int> myCoords(d), coords(1);<br>
> // <fill myCoords here><br>
> if( commRank == 0 )<br>
>     coords.resize( d*commSize );<br>
> MPI_Gather( &myCoords[0], d, MPI_INT, &coords[0], d, MPI_INT, 0, comm );<br>
><br>
> In the above snippet, 'd' is the dimension of the domain, which is two for<br>
> the executable in question, and space for storing every process's<br>
> coordinates is only allocated on the root process. This is pretty<br>
> straightforward MPI in my opinion, so I am skeptical that I have a bug here.<br>
><br>
> Jack<br>
<br>
<br>
<br>
</div></div><div class="HOEnZb"><div class="h5">--<br>
Jeff Hammond<br>
Argonne Leadership Computing Facility<br>
University of Chicago Computation Institute<br>
<a href="mailto:jhammond@alcf.anl.gov">jhammond@alcf.anl.gov</a> / <a href="tel:%28630%29%20252-5381" value="+16302525381">(630) 252-5381</a><br>
<a href="http://www.linkedin.com/in/jeffhammond" target="_blank">http://www.linkedin.com/in/jeffhammond</a><br>
<a href="https://wiki.alcf.anl.gov/parts/index.php/User:Jhammond" target="_blank">https://wiki.alcf.anl.gov/parts/index.php/User:Jhammond</a><br>
</div></div></blockquote></div><br>