    <font size="+1">Hi again,<br>
      A correction on my previous email:<br>
      I may have been confused when I said some of an endorsed-MIPs
      model runs might be excluded from CMIP6.  At the recent WGCM
      meeting we agreed to define tiers of simulations within each
      endorsed-MIP,  but I think Martin's right that all of an
      endorsed-MIP's runs will be included in CMIP6.   So, if this is
      correct, the use case is slightly simpler than stated:  we just
      want the experiments contributed by an endorsed-MIP to appear
      under that MIP's project name, but also under the CMIP6 project
      [By the way the tiering of runs within each MIP is meant to help
      modeling groups prioritize which experiments they want to
      perform.  If they want to contribute to an endorsed MIP, they will
      be expected to at least perform all the experiments in the first
      tier (but they can choose to participate in only some subset of
      the endorsed-MIPs).  (There is actually a slight caveat on this,
      which I won't bother to explain at this point.)]<br>
      best regards,<br>
    <div class="moz-cite-prefix">On 10/28/14, 1:27 PM,
      <a class="moz-txt-link-abbreviated" href="mailto:martin.juckes@stfc.ac.uk">martin.juckes@stfc.ac.uk</a> wrote:<br>
      <pre wrap="">Hello Karl,

I was puzzled by your reference to MIPs doing some experiments "in" CMIP6 and other experiments "not in" CMIP6: I thought the idea was that once a MIP had been suitably blessed as part of the CMIP6 extended family all the experiments within that MIP would have the same status. Is this idea of having multiple classes of experiment spelt out somewhere?


From: Cinquini, Luca (398G) [<a class="moz-txt-link-abbreviated" href="mailto:Luca.Cinquini@jpl.nasa.gov">Luca.Cinquini@jpl.nasa.gov</a>]
Sent: 28 October 2014 19:55
To: Karl Taylor
Cc: <a class="moz-txt-link-abbreviated" href="mailto:wgcm_wip@wcrp-climate.org">wgcm_wip@wcrp-climate.org</a>; <a class="moz-txt-link-abbreviated" href="mailto:go-essp-tech@ucar.edu">go-essp-tech@ucar.edu</a>; <a class="moz-txt-link-abbreviated" href="mailto:cmip-panel@wcrp-climate.org">cmip-panel@wcrp-climate.org</a>
Subject: Re: [Go-essp-tech] ***CHANGE***: Connection info for GO-ESSP call on Tues 10/28/14

Hi Karl,
thanks for attending today, and for your continuos interest and suggestions for improvements. It might be worth discussing these use cases at our next WIP telco, but in the meantime here’s a few quick considerations:

On Oct 28, 2014, at 12:14 PM, Karl Taylor &lt;<a class="moz-txt-link-abbreviated" href="mailto:taylor13@llnl.gov">taylor13@llnl.gov</a><a class="moz-txt-link-rfc2396E" href="mailto:taylor13@llnl.gov">&lt;mailto:taylor13@llnl.gov&gt;</a>&gt; wrote:

Hi Luca and all,

Thanks for the helpful demo this morning on the Go-ESSP tech telecon.  The interface appears to be versatile and the search seems quite a bit better than what is now in place.  I was particularly pleased to see your new option to make multiple selections under each search facet.  I was one of the folks who were hoping to be able to do this, so I appreciate you making that a priority.

Of course, the work is never done, and additional features will always be requested.  Here are two search use cases that might be candidates for future work.  (Before settling on how to proceed, however, I think it would be good to give the WIP a chance to refine the ideas and provide guidance, along with indicating whether this is a priority.)

Case 1:  I want to include in my search all the CMIP6 simulations, but no others.
This would appear to be straightforward, but CMIP6 is being organized in a "distributed" way now, and it really comprises a subset of the experiments that have been performed as part of a number of coordinated, but quasi-independent contributing MIPs.  The individual MIPs plan to perform some simulations which will be included in CMIP6, but others that are not.  I think that each of the MIPs will publish all of their simulations under their own project name.  For example, PMIP might publish an lgm, midHolocene, and past1000 simulations as "PMIP" project runs, but perhaps only the lgm run is included in the CMIP6 project.  Another project, "xMIP" might publish results from 5 expts., but only 2 of these (say "exp1" and "exp2") are included in CMIP6.  Suppose no experiments are originally published with the "CMIP6" project identifier (but instead are published under the name of the MIP directly responsible).  Is there a way for us to construct a virtual project that includes onl
 y lgm and
 exp1 and exp2  (but not midHolocen, or past1000, or exp3, 4, or 5)?  A few options to explore are:
1) publish the CMIP6 runs twice (i.e., both as belonging to its host project but also CMIP6).
2) publish the CMIP6 runs only once, but somehow identify them with both the host project and CMIP6
3) build on the concept of a "family" of experiments, which is part of the current ESGF search capability, and use it to collect different experiments into a single group.
The point is to find a way to select and list all the CMIP6 simulations, but none of the other experiments.

The above use case is certainly feasible, without a lot of additional development. Suggestion 1) above won’t really work because you either create duplicate copies of the data (if you change the ids), or you override the previous copy. But suggestions 2) and 3) can both be implemented by either submitting records with multiple metadata fields ("project=X and project=Y"), or by executing a little server-side processing (“if experiment=X then add experiment_family=Y” - we actually do this already for CMIP5).

Case 2 (discussed briefly on the telecon this morning):  I want to retrieve files containing output from only those models that have carried out *all* experiments and *all* variables of interest.
For example, if I want to analyze correlations between temperature and precipitation differences between the historical and control run, then I want to exclude from my search models that didn't report *both* of these variables for *both* of these runs.

This use case is more difficult because the search always targets datasets, and it would be wrong to tag a single dataset with multiple values of an experiment or a variable that it does not include. Without thinking it over too much, I think this use case could be enabled by some more sophisticated search workflow such as the following:

a) Loop over all possible (experiment, variable) and find list of models that produced that combination
b) Get the intersection of model results form step a). These are the models that produced both variables for both experiments
c) Loop over all the (model, experiment, variable) combinations and download the files

Not easy but it is possible, I guess…. Is the above right ?

thanks again,

Something to begin thinking about, but perhaps waiting to act on until we get further input from others.

Best regards,

On 10/27/14, 3:31 PM, Cinquini, Luca (398G) wrote:
Hi all,
please see this connection information from Cecelia regarding the GO-ESSP meeting tomorrow.
thanks, Luca

Dear all,

The web share and call-in number for tomorrow's demonstration
have changed.  Please use:

