<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><br><div><div>On Feb 1, 2012, at 4:20 PM, Sébastien Denvil wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>Hi Jennifer, all<br><br>see below:<br><br>Le 01/02/2012 17:08, Jennifer Adams a écrit :<br><blockquote type="cite">Hi, Everyone --<br></blockquote><blockquote type="cite">I have been working with Luca and Gavin and Estani on testing the P2P system. I'm happy to report that the many significant parts of my workflow for downloading data can now be fully automated:<br></blockquote><blockquote type="cite">1. Search for available data sets that meet my desired requirements (e.g. decadal1980/atmos/mon/Amon, all models, all members, selected variables)<br></blockquote><blockquote type="cite">2. Compare search results to a list of what I've already got<br></blockquote><blockquote type="cite">3. Build script to download and run wget scripts for datasets I still need<br></blockquote><blockquote type="cite">All this using shell scripts and without touching a browser!<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">There are still a few wrinkles, however. The worst of these is that not all data nodes are authenticating certificates properly.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">These data nodes are working:<br></blockquote><blockquote type="cite"><a href="http://bmbf-ipcc-ar5.dkrz.de">bmbf-ipcc-ar5.dkrz.de</a><br></blockquote><blockquote type="cite">cmip-dn.badc.rl.ac.uk<br></blockquote><blockquote type="cite">dias-esg-nd.tkl.iis.u-tokyo.ac.jp<br></blockquote><blockquote type="cite"><a href="http://esgdata.gfdl.noaa.gov">esgdata.gfdl.noaa.gov</a><br></blockquote><blockquote type="cite"><a href="http://esg.cnrm-game-meteo.fr">esg.cnrm-game-meteo.fr</a><br></blockquote><blockquote type="cite"><a href="http://norstore-trd-bio1.hpc.ntnu.no">norstore-trd-bio1.hpc.ntnu.no</a><br></blockquote><blockquote type="cite"><a href="http://pcmdi11.llnl.gov">pcmdi11.llnl.gov</a><br></blockquote><blockquote type="cite"><a href="http://vesg.ipsl.fr">vesg.ipsl.fr</a><br></blockquote><br>To help you diagnose the source of your PKI issues :<br><br><blockquote type="cite">These data nodes are not:<br></blockquote><blockquote type="cite"><a href="http://dap.cccma.uvic.ca">dap.cccma.uvic.ca</a><br></blockquote><br>It works for us as I write. PCMDI openid if it matters.<br></div></blockquote>I believe it does matter which OpenID you use, and PCMDI is the one that works. Gavin told me that he didn't have many problems with downloads from these nodes either. I think it makes a difference whether you are wgetting from a data node or from someplace else. Gavin seems to have the keys to all the castles.</div><div><br><blockquote type="cite"><div><br><blockquote type="cite"><a href="http://esg.nccs.nasa.gov">esg.nccs.nasa.gov</a><br></blockquote>We have never been able to download from there using PKI.<br></div></blockquote>I got some email directly from Ellen Salmon at GSFC who explained that they have been working for months to get all the upgraded ESGF software packages to work properly, but there is hope that it will be working soon (~weeks). I know this has been a chronic problem for data node administrators.</div><div><br><blockquote type="cite"><div><br><blockquote type="cite"><a href="http://bcccsm.cma.gov.cn">bcccsm.cma.gov.cn</a><br></blockquote>We have been able to download from there using PKI recently.<br></div></blockquote>This one fails 95% of the time for me. Estani says BCC is a special case.</div><div><br><blockquote type="cite"><div><br><blockquote type="cite"><a href="http://tds.ucar.edu">tds.ucar.edu</a><br></blockquote>We have been able to download from there using PKI recently.<br></div></blockquote>This may another case of it working for requests from other data nodes.&nbsp;</div><div><br><blockquote type="cite"><div><br><blockquote type="cite"><a href="http://pcmdi9.llnl.gov">pcmdi9.llnl.gov</a><br></blockquote>We used pcmdi3 up to know (it worked), will give a try to pcmdi9<br></div></blockquote>Gavin has been tweaking this one lately. I haven't tested it in the past few days.&nbsp;</div><div><br><blockquote type="cite"><div><br><blockquote type="cite"><a href="http://esg-datanode.jpl.nasa.gov">esg-datanode.jpl.nasa.gov</a><br></blockquote>Did not tried yet.<br><br><blockquote type="cite"><br></blockquote><blockquote type="cite">P2P wget scripts to download data from the second set of data nodes always fail completely (for me, a "pure client" user). I know that Luca and Gavin and Estani are working to fix these problems, but here's some encouragement to the data node administrators to help them resolve this issue. Wgets that rely on the quickly-expiring authorization tokens ought to be deprecated as soon as possible -- they are the biggest, most irritating source of errors in the whole system (my opinion only).<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">The second problem is that the wget scripts don't often succeed in getting all the files they are configured to grab. Of the 64 scripts that I ran this morning, 55 were incomplete (that's 86%). The errors in log files are all "ERROR 403: Forbidden." I was running the 64 scripts at one time, but each one was grabbing its list of files in order -- I am not parallelizing the wgets in the way that some other users have described. When I rerun the wget scripts from the incomplete runs, some of them finish the job on the 2nd try, others will take as many as 8 tries before all the files are in.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">These are the data nodes that are not allowing me to complete the download (for the decadal1980 example mentioned above).<br></blockquote><blockquote type="cite"><a href="http://esg.cnrm-game-meteo.fr">esg.cnrm-game-meteo.fr</a><br></blockquote><blockquote type="cite"><a href="http://vesg.ipsl.fr">vesg.ipsl.fr</a><br></blockquote><blockquote type="cite">dias-esg-nd.tkl.iis.u-tokyo.ac.jp<br></blockquote><blockquote type="cite">cmip-dn.badc.rl.ac.uk<br></blockquote><blockquote type="cite"><a href="http://bmbf-ipcc-ar5.dkrz.de">bmbf-ipcc-ar5.dkrz.de</a><br></blockquote><br>I notice that those node seems to be far away from your home location.<br>May I suggest you to give those options to wget ; from our experiences with synchro-data they appear to improve substantially the success rate :<br>wget --timeout=20 --tries=10<br></div></blockquote>I will definitely give those options a try.&nbsp;</div><div><br><blockquote type="cite"><div><br>A lot has been said about this issue.</div></blockquote><div>I'm sorry I didn't go searching through the forum archives before writing about wget failures. I didn't join this list until fairly recently, when I started to actively work on downloading CMIP5 data. I was subscribed to plain go-essp (not tech) and there was no traffic at all. Here is where the the players are!! I'm glad I'm here … lately I've been following the threads in this forum with more interest than in my own GrADS forum.&nbsp;</div><br><blockquote type="cite"><div> Difficult to attribute properly the responsibility of those failure to such or such components/parties. Give a try to the parameter above.<br><br>If you send me the IP adress you used we could investigate the <a href="http://vesg.ipsl.fr">vesg.ipsl.fr</a> case.<br></div></blockquote>The boxes I have been using are inside a firewall and do not have public IP addresses. I did a test by pinging my public GDS from there and in the log file it came up as <a href="http://cola.gmu.edu">cola.gmu.edu</a>.&nbsp;</div><div><br><blockquote type="cite"><div><br><blockquote type="cite">I suspect there are some throttling settings in place to limit the number of wgets that a data node will allow at any particular time. I think my use of the data nodes is reasonable, and these throttles are set too high.<br></blockquote><br>It's quiet hard to set this up properly using a tomcat free version. Some commercial tomcat version offers easiest way to achieve that. Up to know (on our node : <a href="http://vesg.ipsl.fr">vesg.ipsl.fr</a>) we haven't done anything specific regarding that.<br></div></blockquote>Huh! Well, if you think it would be worthwhile, I would be willing to try to slam your data node with a barrage of wgets from one of our servers that has a resolvable IP and we could see what it takes to receive the Forbidden error on a default tomcat implementation.&nbsp;</div><div>--Jennifer</div><div><br><blockquote type="cite"><div><br>regards.<br>Sébastien<br><blockquote type="cite">The dreaded "Forbidden" errors may be related to another problem, but are still a nuisance no matter what the reason. YAO (Yet Another Obstacle). Please put this on the high priority list of things to fix, right behind the certificate authentication issue.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Respectfully submitted,<br></blockquote><blockquote type="cite">Jennifer<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">GO-ESSP-TECH mailing list<br></blockquote><blockquote type="cite"><a href="mailto:GO-ESSP-TECH@ucar.edu">GO-ESSP-TECH@ucar.edu</a><br></blockquote><blockquote type="cite"><a href="http://mailman.ucar.edu/mailman/listinfo/go-essp-tech">http://mailman.ucar.edu/mailman/listinfo/go-essp-tech</a><br></blockquote><br><br>-- <br>Sébastien Denvil<br>IPSL, Pôle de modélisation du climat<br>UPMC, Case 101, 4 place Jussieu,<br>75252 Paris Cedex 5<br><br>Tour 45-55 2ème étage Bureau 209<br>Tel: 33 1 44 27 21 10<br>Fax: 33 1 44 27 39 02<br><br><br>_______________________________________________<br>GO-ESSP-TECH mailing list<br><a href="mailto:GO-ESSP-TECH@ucar.edu">GO-ESSP-TECH@ucar.edu</a><br>http://mailman.ucar.edu/mailman/listinfo/go-essp-tech<br></div></blockquote></div><br><div apple-content-edited="true">
<span class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><span class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><span class="Apple-style-span" style="border-collapse: separate; border-spacing: 0px 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; text-align: auto; -khtml-text-decorations-in-effect: none; text-indent: 0px; -apple-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div>--</div><div>Jennifer M. Adams</div><div>IGES/COLA</div><div>4041 Powder Mill Road, Suite 302</div><div>Calverton, MD 20705</div><div><a href="mailto:jma@cola.iges.org">jma@cola.iges.org</a></div><div><br class="khtml-block-placeholder"></div><br class="Apple-interchange-newline"></span></span></span>
</div>
<br></body></html>