<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
  <title></title>
</head>
<body text="#000000" bgcolor="#ffffff">
Jon,<br>
<br>
Before you embark upon a grand software adventure to solve the specific
problems you have identified I think you carefully review the work of
other groups to make sure you don't end up just recreating an in house
version of what other projects are already committed to.&nbsp; Projects that
come immediately to mind are NetCDF,
OPeNDAP, OPeNDAP aggregation servers, our own FDS, GDS from COLA,
CDAT from PCMDI, Benno's Ingrid, etc.<br>
<br>
I bring this up after having a look at your data portal page (<a
 href="http://www.nerc-essc.ac.uk/godiva">http://www.nerc-essc.ac.uk/godiva</a>).&nbsp;
On this page you have borrowed heavily from the LAS interface,
improving the dataset selection with an interactive menu on the left
hand side.&nbsp; All of this is well and good, folks are welcome to borrow
bits and pieces of code as they see fit.&nbsp;&nbsp; But in
the godiva case I will note that by largely reinventing the data access
interface you have missed out on the incremental improvements (e.g. a
non-applet clickable map in LAS) that gradually accumulate in long term
funded and highly focused projects like LAS or NetCDF or OPeNDAP.<br>
<br>
The functionality you envision for your data system seems quite
daunting to me.&nbsp; I would imagine it to be a multi-year job for a team
of programmers to create such a system from scratch and have it
actually
work better than current systems.&nbsp; And in those 5 years the current
systems will have gotten incrementally better as well.&nbsp; I imagine you
would have much better success by gluing together existing pieces
rather than expecting a single application to do it for you.&nbsp; As Steve
points out, there are already packages that can do 1-4 and it seems to
me that the community would benefit most by seeing how a single
institution can create an excellent site by gluing bits and pieces
together. <br>
<br>
Have a look at the overview of CDAT to see how they have approached a
similar problem:<br>
<blockquote><a class="moz-txt-link-freetext" href="http://esg.llnl.gov/cdat/overview.html">http://esg.llnl.gov/cdat/overview.html</a><br>
</blockquote>
<br>
<br>
All the best whichever path you take,<br>
<br>
<br>
-- Jon<br>
<br>
<br>
<br>
<br>
Steve Hankin wrote:<br>
<blockquote type="cite" cite="mid41A4C5AA.3180921C@noaa.gov">Hi Jon,
  <p>When you refer to "standard flat files" are you including formats
like
netCDF and HDF5 under that title?&nbsp; This is often a source of
terminology
confusion as "flat files" sometimes refers to "anything but a
database".&nbsp;
Others regard n-dimensional, multi-variate data standards like netCDF
and
HDF to be alternatives to "flat" IEEE files.
  </p>
  <p>The question that you pose is essentially to weigh the pros and
cons
of managing your data with a commercial database that has been enhanced
to handle grids, or to handle your data with netCDF (which in the next
version will merge with HDF5 to handle compression, tiles, etc.) and
the
free netCDF utilities.&nbsp; (Presumably from-scratch development with
IEEE binary files is not the way to go.)&nbsp; You mentioned some down-sides
to the commercial software route (cost, "proprietariness" of software,
dependence on a single supplier,...).&nbsp;&nbsp; Are the advantages of
the database approach sufficient to outweigh these costs?&nbsp;&nbsp; You
have also not mentioned network access to the data.&nbsp; Is it a
requirement
is for the data to be OPeNDAP accessible?&nbsp; Or alternatively, is access
from enterprise GIS systems at the center of your bullseye?
  </p>
  <ul>
    <li>
Items 1-2 are trivial for either system.&nbsp; Comparative performance
... do you have any data?&nbsp; The Barrodale product is new and
one-of-a-kind.&nbsp;
It would be interesting to see some benchmarks comparing it to netCDF
and
HDF5.</li>
    <li>
Items 3-4 can be handled with the new FDS (Ferret Data Server) and
probably
the GDS server, as well.&nbsp; Custom code may be required depending upon
the list of projections that is desired, but these are open
environments,
where this can be added.&nbsp;&nbsp; Item 3-4 capabilities are also available
and presumably well supported if your database is embedded in an
enterprise
GIS framework.</li>
    <li>
Item 5 is probably better handled in a database environment, though it
can also be handled (with some effort -- in various ways) in a Web
service
environment based on OPeNDAP.</li>
  </ul>
Just bouncing around the ideas.&nbsp; This community will be interested
to hear what further you learn.
  <p>&nbsp;&nbsp;&nbsp; - steve
  </p>
  <p>====================================
  </p>
  <p>Jon Blower wrote:
  </p>
  <blockquote type="CITE">Hi all,
    <p>As some of you may know, we at the Reading e-Science Centre have
been
    <br>
investigating some new ways to store and manage data from models of
the
    <br>
oceans and atmosphere.&nbsp; We have been looking at storing data in
databases,
    <br>
rather than standard flat-file systems, and have over the last few
months
    <br>
been evaluating IBM's Informix database with Barrodale Computing
Services'
    <br>
Grid DataBlade plug-in (see <a
 href="http://www.resc.rdg.ac.uk/projects.php">http://www.resc.rdg.ac.uk/projects.php</a>
for more
    <br>
details).&nbsp; Eventually this might form the back-end to our own
data portal
    <br>
page (<a href="http://www.nerc-essc.ac.uk/godiva">http://www.nerc-essc.ac.uk/godiva</a>).
    </p>
    <p>We have found good and bad points about this system and are now
wondering
    <br>
how to take things forward.&nbsp; I have been considering the feasibility
of
    <br>
writing (essentially from scratch) an intelligent storage/management
    <br>
application for gridded geospatial data.&nbsp; The key features of
this system
    <br>
would include:
    </p>
    <p>1) Data would be stored in a single format but can be extracted
in a
variety
    <br>
of formats
    <br>
2) Data could be sliced and subsetted in all possible ways (e.g.
extraction
    <br>
of 1-D timeseries, 2-D areas, 3-D volumes/animations, 4-D data blocks)
and
    <br>
extracted at different spatial and temporal resolutions
    <br>
3) Data could be stored on the original grid (including rotated grids)
but
    <br>
extracted on the grid of the user's choice
    <br>
4) The necessary projection and interpolation would happen on the fly
    <br>
5) The system would allow complex queries to be made (e.g. "Give me
all the
    <br>
times and locations at which the sea surface temperature was greater
than 20
    <br>
degC in the North Atlantic in June 2003")
    </p>
    <p>The systems we have looked at so far get us part, but not all,
of the
way
    <br>
there.&nbsp; Furthermore, the system currently under evaluation
(Informix/Grid
    <br>
DataBlade) is closed-source, commercial software so we can't modify
it
    <br>
ourselves.&nbsp; However, such database-based systems have some key
advantages
    <br>
over standard flat files, notably intelligent tiling and caching,
giving
    <br>
very fast retrieval of data.
    </p>
    <p>I was wondering whether this community would welcome an effort
to create
an
    <br>
open-source data management/storage system for geospatial data, perhaps
as a
    <br>
plug-in to an open-source DBMS such as PostgreSQL.&nbsp; I haven't
found an
    <br>
existing project that answers our requirements, but please let me know
if
    <br>
you know of anything (some packages seem to deal with geospatial data,
but
    <br>
are not designed for _gridded_ data).&nbsp; It seems that this could
be of
    <br>
benefit to a to the GO-ESSP community, considering that any Earth
System
    <br>
Portal must be backed by some kind of data store! ;-)
    </p>
    <p>This has been rather a long post, sorry!&nbsp; Any suggestions or
feedback
would
    <br>
be very much appreciated.
    </p>
    <p>Best wishes,
    <br>
Jon
    </p>
    <p>--------------------------------------------------------------
    <br>
Dr Jon Blower&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Tel: +44 118 378 5213 (direct line)
    <br>
Technical Director&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Tel: +44 118 378 8741 (ESSC)
    <br>
Reading e-Science Centre&nbsp;&nbsp; Fax: +44 118 378 6413
    <br>
ESSC&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Email: <a class="moz-txt-link-abbreviated" href="mailto:jdb@mail.nerc-essc.ac.uk">jdb@mail.nerc-essc.ac.uk</a>
    <br>
University of Reading
    <br>
3 Earley Gate
    <br>
Reading RG6 6AL, UK
    <br>
--------------------------------------------------------------
    </p>
    <p>_______________________________________________
    <br>
GO-ESSP mailing list
    <br>
<a class="moz-txt-link-abbreviated" href="mailto:GO-ESSP@ucar.edu">GO-ESSP@ucar.edu</a>
    <br>
    <a href="http://mailman.ucar.edu/mailman/listinfo/go-essp">http://mailman.ucar.edu/mailman/listinfo/go-essp</a></p>
  </blockquote>
  <p>--
  </p>
  <p>Steve Hankin, NOAA/PMEL -- <a class="moz-txt-link-abbreviated" href="mailto:Steven.C.Hankin@noaa.gov">Steven.C.Hankin@noaa.gov</a>
  <br>
7600 Sand Point Way NE, Seattle, WA 98115-0070
  <br>
ph. (206) 526-6080, FAX (206) 526-6744
  <br>
&nbsp;</p>
  <pre wrap="">
<hr width="90%" size="4">
_______________________________________________
GO-ESSP mailing list
<a class="moz-txt-link-abbreviated" href="mailto:GO-ESSP@ucar.edu">GO-ESSP@ucar.edu</a>
<a class="moz-txt-link-freetext" href="http://mailman.ucar.edu/mailman/listinfo/go-essp">http://mailman.ucar.edu/mailman/listinfo/go-essp</a>
  </pre>
</blockquote>
</body>
</html>