Research staat voor ICT challenge

Onze klassen vullen zich in rap tempo met researchers. De vraag naar open source technologie in research, met name Python/NumPy, groeit. Elk domein lijkt haar eigen vraagstukken te hebben. Waar komt deze groei vandaan?

Drie issues: Big Data, HPC en infrastructure.

Door technologische vooruitgang worden enorme hoeveelheden data (we spreken al van yottabytes) van uiteenlopend signatuur geproduceerd. Deze moeten (eenduidig en gestructureerd) worden bewaard, maar ook geanalyseerd, verwerkt en gereproduceerd, met hoge snelheid. Het gaat om complexe mathematische vraagstukken, die vragen om high performance computing en het (flexibel) schalen van infrastructuren.

De bron

Op zoek naar oorzaken zijn we in gesprek gegaan met de grootste groep; de kennisinstituten en R&D-bedrijven in de biotechnologie. Voordat we het wisten stonden we tot aan de oksels in de wondere wereld van genomics en next generation sequency. De DNA-analyse-technologie heeft de laatste jaren een grote vlucht genomen. Het goede nieuws is dat er veel informatie in hoog tempo geproduceerd wordt. Het slechte nieuws is dat de informatietechnologie het nauwelijks bijbeent in bits, bytes en brains van de reseachers. In de astronomie zijn het de exabytes aan data die de telescopen en satellieten produceren, in de maritieme techniek en de infra de petabytes aan 3D research data uit metingen en analyses.

Academic Crapware

We maakten kennis met een hele nieuwe wereld. Een aantal observaties:

  • Researchers hebben goed ontwikkelde self learning skills, maar lopen tegen de grenzen aan van hun eigen kennis & kunnen én van de software (o.a. door ‘verkeerde’ keuzes vooraf).
  • De organisch gegroeide software omgeving is gedifferentieerd en onoverzichtelijk; veel verschillende soorten programmeertalen, operating systems, oude software (oude inefficiënte en vaak trage constructies, veel interfaces enz.).
  • De groeiende behoefte aan ‘computing power’ is ingevuld door het bijkopen/ installeren van nieuwe nodes, zonder de bestaande infrastructuur te optimaliseren.
  • Researchers werken in autonoom opererende groepen aan projecten en ontwikkelen binnen hun eigen domein hun eigen infrastructuur en software oplossingen. Er lijkt tussen de groepen nauwelijks te worden gecommuniceerd. Er is bovendien een ogenschijnlijk dikke muur tussen R&D en de ICT omgeving die de organisatie in ERP/administratief opzicht ondersteunt.

De sleutel

Een belangrijke pijn is de kloof tussen hoogwaardige wetenschappelijke domeinkennis en gedegen ICT-kennis. Universiteiten werken hard aan scholing in programmeertalen en projectmanagement, maar de basisvaardigheden van het programmeren en automatiseren worden overgeslagen. De groei van het aantal bio-informatici en data-scientists geeft hoop voor de toekomst.

In de tussentijd werken wij hard aan onze domeinkennis, met hulp van researchers uit alle domeinen. In sparringsessies van een dag ruilen we kennis. Zo bouwen we ons aanbod uit:

  • in-company maatwerk trainingen met integratie van domeinspecifieke scripts
  • een cursus ‘Leren programmeren voor researchers’ en GIT (versiebeheer)
  • consultancy & advies t.a.v. optimalisatie van software en infrastructuren
  • expertsessies over open source technologie & configuratiemanagement

    We zijn terug bij onze roots als startup ‘avant la lettre’ van de Faculteit Wiskunde aan de Universiteit van Nijmegen. Met ingang van 1 juli zijn we partner van het Dutch Techcentre for Lifesciences. Op 28 en 29 september staan we met SURFsara op de DutchBioPhysics.

In oktober willen we een Meetup organiseren om researchers bij elkaar te brengen voor de uitwisseling van kennis en ervaring. Wordt vervolgd!

Onderwerpen
Actieve filters: Wis alle filters
Loading...