<html><head><base href="x-msg://39/"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi Stephen,<div><span class="Apple-tab-span" style="white-space:pre">        </span>to answer some of your questions...</div><div><br></div><div>o The p2p index will harvest all properties in the THREDDS catalogs. Infact, I was able to run a quick job and ingest that catalog in our prototype system - you can search for "cordex" at this URL:</div><div><br></div><div><a href="http://esg-datanode.jpl.nasa.gov/esgf-web-fe/">http://esg-datanode.jpl.nasa.gov/esgf-web-fe/</a></div><div><br></div><div>As you can see, I have defined two facets: "CORDEX_domain" and "Frequency" (upper case!) that relate to the metadata in that catalog. As I was mentioning, the metadata just flows through.</div><div><br></div><div>o Note that I think some of the metadata property names should really be lower case, instead of upper case.... at least that's the CMIP5 convention. Off course we could change the case while parsing the catalogs</div><div><br></div><div>o Your last point about inheriting metadata is exactly what we were discussing with Charles and others in previous days. Charles asked that, in order to make the search for files more powerful, we tag all files that belong to a dataset with the properties that belong to the dataset: this way, you could make a search for files subject to the constraints experiment=X, frequency=Y and model=Z. This is something that is not difficult to do, but we haven't done yet because it means "interpreting" the catalogs as opposed to just "parsing" them. But it looks like there is enough momentum behind this requirement that we should go ahead and do it...</div><div><br></div><div>o Finally, note that so far the p2p search only looks for Datasets - this is to limit the number of results. We could as well look for Files, if we wanted, from the web interface.</div><div><br></div><div>thanks, Luca</div><div><br></div><div><br><div><div>On Jun 1, 2011, at 7:59 AM, &lt;<a href="mailto:stephen.pascoe@stfc.ac.uk">stephen.pascoe@stfc.ac.uk</a>&gt; wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div bgcolor="white" lang="EN-GB" link="blue" vlink="purple"><div class="WordSection1" style="page: WordSection1; "><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">(note I CC'd<span class="Apple-converted-space">&nbsp;</span><a href="mailto:gonzalez@dkrz.de" style="color: blue; text-decoration: underline; ">gonzalez@dkrz.de</a><span class="Apple-converted-space">&nbsp;</span>by mistake -- I meant go-essp)<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">Hi Roland,<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">I suppose what I'm getting at is would the Gateway detect driving_model_id=ERAINT should result in a facet value for that dataset or just ignore it.&nbsp; Also I think the P2P index node will index files and datasets separately.&nbsp; In theory it should therefore include this facet to both the dataset and all files it contains but will it now and should it in the future?<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">More generally, do we want to use this inheritance feature for key/value pairs that result in facets in our user interfaces and search APIs?&nbsp; This gets to an underlying design decision about what information we expose at the file level and what at the dataset level.&nbsp; It is the case that each CMIP5 file has a model_id but this property isn't exposed in the THREDDS as file properties, only dataset properties.<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">Cheers,<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); ">Stephen.<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; color: rgb(31, 73, 125); ">---<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; color: rgb(31, 73, 125); ">Stephen Pascoe&nbsp; +44 (0)1235 445980<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; color: rgb(31, 73, 125); ">Centre of Environmental Data Archival<o:p></o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; color: rgb(31, 73, 125); ">STFC Rutherford Appleton Laboratory, Harwell Oxford, Didcot OX11 0QX, UK<o:p></o:p></span></div></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="color: rgb(31, 73, 125); "><o:p>&nbsp;</o:p></span></div><div><div style="border-right-style: none; border-bottom-style: none; border-left-style: none; border-width: initial; border-color: initial; border-top-style: solid; border-top-color: rgb(181, 196, 223); border-top-width: 1pt; padding-top: 3pt; padding-right: 0cm; padding-bottom: 0cm; padding-left: 0cm; "><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><b><span lang="EN-US" style="font-size: 10pt; font-family: Tahoma, sans-serif; color: windowtext; ">From:</span></b><span lang="EN-US" style="font-size: 10pt; font-family: Tahoma, sans-serif; color: windowtext; "><span class="Apple-converted-space">&nbsp;</span>Roland Schweitzer [mailto:Roland.Schweitzer@noaa.gov]<span class="Apple-converted-space">&nbsp;</span><br><b>Sent:</b><span class="Apple-converted-space">&nbsp;</span>01 June 2011 14:49<br><b>To:</b><span class="Apple-converted-space">&nbsp;</span>Pascoe, Stephen (STFC,RAL,RALSP)<br><b>Cc:</b><span class="Apple-converted-space">&nbsp;</span><a href="mailto:esg-node-dev@lists.llnl.gov" style="color: blue; text-decoration: underline; ">esg-node-dev@lists.llnl.gov</a>;<span class="Apple-converted-space">&nbsp;</span><a href="mailto:gonzalez@dkrz.de" style="color: blue; text-decoration: underline; ">gonzalez@dkrz.de</a><br><b>Subject:</b><span class="Apple-converted-space">&nbsp;</span>Re: [esg-node-dev] Use of &lt;metadata&gt; element in THREDDS catalogs<o:p></o:p></span></div></div></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><o:p>&nbsp;</o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">Hi All,<br><br>I agree that we need to formalize an ESG profile.<span class="Apple-converted-space">&nbsp;</span><br><br>To that end, the THREDDS XML schema allows for the inheritance of metadata to be controlled by an attribute.&nbsp; And the schema allows for more than one &lt;metadata&gt; element with different inheritance in a particular &lt;dataset&gt;.&nbsp; Perhaps all that is needed is to get the inheritance right.<br><br>But, isn't it the case in the example you sent that the inheritance is in fact correct.&nbsp; A variable in this data set has the property driving_model_id=ERAINT, for example.&nbsp; What are the properties that were added that should not be inherited?&nbsp;<span class="Apple-converted-space">&nbsp;</span><br><br>Roland<br><br>On 06/01/2011 04:18 AM,<span class="Apple-converted-space">&nbsp;</span><a href="mailto:stephen.pascoe@stfc.ac.uk" style="color: blue; text-decoration: underline; ">stephen.pascoe@stfc.ac.uk</a><span class="Apple-converted-space">&nbsp;</span>wrote:<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">Hi all,<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">I've just received an excellent example of why we need to formalise an ESG profile for THREDDS catalogs.&nbsp; Henrik Wiberg has added some extra THREDDS properties to support the CORDEX project (see the attached email for links).&nbsp; He's put these properties in a &lt;metadata&gt; element within the top-level dataset element.&nbsp; This is valid THREDDS but I'm not sure what ESG would do with it.<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">Properties in &lt;metadata&gt; elements implies they apply to all dataset elements contained within the current one.&nbsp; Now the new search engine will index properties in files as well as datasets we need to decide whether we are going to support this feature of THREDDS.&nbsp; My guess is that the Gateway and P2P index wouldn't process this right.<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">My instinct is that there should be a clear distinction between properties associated with a dataset and those associated with the files it contains -- therefore in this case we'd need to move the properties out of the metadata section.<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">Cheers,<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">Stephen.<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; ">---</span><o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; ">Stephen Pascoe&nbsp; +44 (0)1235 445980</span><o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; ">Centre of Environmental Data Archival</span><o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 10.5pt; font-family: Consolas; ">STFC Rutherford Appleton Laboratory, Harwell Oxford, Didcot OX11 0QX, UK</span><o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; ">&nbsp;<o:p></o:p></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 12pt; font-family: 'Times New Roman', serif; "><o:p>&nbsp;</o:p></span></div><p style="margin-right: 0cm; margin-left: 0cm; font-size: 12pt; font-family: 'Times New Roman', serif; color: black; ">--<span class="Apple-converted-space">&nbsp;</span><br>Scanned by iCritical.<o:p></o:p></p><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 12pt; font-family: 'Times New Roman', serif; "><o:p>&nbsp;</o:p></span></div><div style="margin-right: 0cm; margin-left: 0cm; font-size: 11pt; font-family: Calibri, sans-serif; color: black; margin-top: 0cm; margin-bottom: 0.0001pt; "><span style="font-size: 12pt; font-family: 'Times New Roman', serif; "><o:p>&nbsp;</o:p></span></div></div><br><p style="margin-right: 0cm; margin-left: 0cm; font-size: 12pt; font-family: 'Times New Roman', serif; color: black; ">--<span class="Apple-converted-space">&nbsp;</span><br>Scanned by iCritical.</p><br></div><br class="Apple-interchange-newline"></blockquote></div><br></div></body></html>