Data engineer

Nieuw

Functie omschrijving

De kandidaat gaat verschillende datateams bij gemeente Amsterdam helpen met het migreren van hun bestaande datapipelines naar Databricks op het Azure-platform. Dit doet de kandidaat door mee te werken, te adviseren en mee te denken met de teamleden. De huidige datapipelines zijn gemaakt op basis van PostgreSQL queries en functies. Als datateams ontsluiten we niet alleen maar data, een groot deel van ons werk is ook het koppelen van data en het maken van (complexe) afleidingen. Een simpel voorbeeld hiervan is dat we vastgoed en gebiedsdata ontsluiten, we koppelen de vastgoed data aan de gebiedsinformatie, zodat we weten in welke buurt de vastgoed-objecten liggen. Daarna leiden we af welke vastgoed-objecten een woning zijn en maken we statistieken over de hoeveelheid woningen per buurt.

Werkzaamheden

In het kort omvatten de werkzaamheden het meewerken met de datateams en meedenken en adviseren over hoe we van onze huidige werkwijze naar een geoptimaliseerd en efficiënt data verwerkings- en verrijkingsproces in Databricks komen. Hieronder valt ook het deployen van ontwikkelomgeving naar productie.

Doelstellingen van de opdracht De kandidaat helpt de teams met:

Opdracht Resultaat Coachen en kennis overdragen naar de teamleden Teamleden kunnen na afloop van de opdracht zelfstandig bestaande pipelines migreren.
Het najagen van kennisdelen en use case uitwerkingen om tot best practices te komen gedurende de migraties van datawarehouses en cloudVPS naar azure dataplatform Organiseren van minimaal 3 events Het omschrijven van bestaande datapipelines naar geautomatiseerde datapipelines in Databricks in de Cloud.

Bestaande code is gemigreerd naar Azure omgeving (Databricks/Azure Devops/Azure blob storage) Je controleert of de resultaten van een gemigreerde datapipeline exact dezelfde resultaat opleveren als in de oude omgeving.

Gemigreerde code is nauwkeurig gecontroleerd op onjuistheden.

Meedenken en adviseren over hoe we van onze huidige werkwijze naar een geoptimaliseerd en efficiënt data verwerkings[1]Geoptimaliseerde data pipelines in Databricks en verrijkingsproces in Databricks en Azure komen.

Je geeft advies en denkt mee over hoe we onze data pipelines met behulp van Git kunnen deployen in productie.

Een goed systeem om te kunnen deployen van ontwikkel omgeving naar productie omgeving.

Actief samenwerken met de overige datateamleden door tijdens het werk jouw kennis over te dragen, onder andere door feedback te geven op code van collega’s.

Teamleden kunnen met vragen terecht bij de kandidaat en kunnen door ondersteuning betere pipelines bouwen en code schrijven.

Het integreren en modelleren van data conform richtlijnen en standaarden van de data office en conform architectuur principes. De pipelines hebben een goede architectuur waar we op voort kunnen bouwen.

De opdrachtgever(s)

Gemeentelijke organisatie

De gemeentelijke organisatie bestaat uit 5 clusters, een bestuurs- en concernstaf, 7 stadsdelen en 1 stadsgebied. De stadsdelen besturen samen met de gemeenteraad, burgemeester en wethouders de stad Amsterdam. De 5 clusters zijn: Ruimte en Economie, Sociaal, Stadbeheer, Bedrijfsvoering, Digitalisering, Innovatie en Informatie. De clusters hebben expertise op een specifiek terrein, zoals sport, jeugd of parkeren. Zij werken beleid uit tot stadsbrede kaders waarbinnen de stadsdelen het uitvoerende werk kunnen doen. Ook bieden zij directe ondersteuning aan bewoners die dit nodig hebben, bijvoorbeeld op het gebied van participatie of werk. De stadsdelen houden zich onder andere bezig met de inrichting van straten en pleinen, groen en parken en welzijnswerk in de buurt. Ze zorgen ervoor dat wat ze doen, past bij de behoeften in hun stadsdeel en bij het beleid voor de hele stad. Meer informatie over de gemeentelijke organisatie is te vinden op: https://www.amsterdam.nl/.

De opdrachtgever(s)

Digitalisering bij gemeente Amsterdam
Bewoners, ondernemers en bezoekers van de stad Amsterdam verwachten een optimaal functionerende stad die aansluit bij de digitale toekomst. Dat betekent dat wij als gemeente moeten blijven innoveren om een steeds sneller transformerende stad gepast te kunnen blijven coördineren en bedienen. Daarom digitaliseert het i-domein, het IT, Innovatie & Data onderdeel van gemeente Amsterdam, de dienstverlening aan de stad in rap tempo. Zodat we een voorbeeldfunctie kunnen uitdragen in het op een veilige, verantwoorde en toekomstbestendige manier omgaan met technologie en informatie voor en in onze stad. Door een vooruitziende blik en inrichting van diensten, vormt de gemeente Amsterdam daarnaast een optimaal solide entiteit die bestand is tegen een toenemende dreiging van buitenaf voor ons digitale netwerk. Digitaliseren betekent hoofdzakelijk dat we fors investeren komende jaren in de hiervoor benodigde kennis en competenties van onze medewerkers, dat we gemeentebrede omscholingstrajecten voor banen van de toekomst organiseren en dat agile werken de norm is in het IT, Innovatie & Data onderdeel. Als jij voor gemeente Amsterdam als werkgever kiest kom je dus terecht in een digitaal zo optimaal mogelijk ingericht organisatieonderdeel, waarin de interne organisatie zo efficiënt mogelijk is ingericht. Werken bij gemeente Amsterdam betekent daardoor leren en kennis delen in een vooruitstrevende organisatie die de digitale maatschappij van nu en in de toekomst succesvol bedient.

De directie data & de vakgroep data engineering
De directie Data is verantwoordelijk voor het centraal ontsluiten, koppelen en leveren van gegevens. De vakgroep Data engineering bestaat uit 45 data engineers die dagelijks werken aan het verhogen van de beschik- en betrouwbaarheid van data, met de hoogst mogelijke kwaliteit.

Functie eisen

  • De aangeboden kandidaat beschikt minimaal over een WO werk- en denkniveau.
  • De aangeboden kandidaat is in het bezit van een erkende hbo/wo diploma.
  • De aangeboden kandidaat beschikt over minimaal 4 jaar werkervaring, die is opgedaan in complexe IT omgevingen en beschikt over recente werkervaring als data engineer en backend software engineer in een grotere, complexe data georiënteerde omgeving.
  • De aangeboden kandidaat heeft ervaring met SQL, Python, CI/CD, PySpark, Kubernetes, Git.
  • De aangeboden kandidaat heeft ervaring in optimalisatie van DevOps processen.De aangeboden kandidaat heeft ervaring met data architectuur en data modellering.

Wensen

  • De aangeboden kandidaat beschikt over ervaring met het opzetten van een testomgeving.
  • De aangeboden kandidaat beschikt over ervaring met het opzetten van CI/CD en deployment processen.
  • De aangeboden kandidaat beschikt over ervaring met het coördineren van data events.

Extra info

• Startdatum: z.s.m.
• Einddatum: 12 maanden na start
• Werklocatie: President Kennedylaan, 923, 1079MZ, AMSTERDAM
• Aantal uren per week: 32-36 uur
• Optioneel tot verlenging conform duur werkzaamheden: ja, met een maximum van 24 maanden vanaf de startdatum

Locatie

Amsterdam

Publicatiedatum

08.10.2024

Publicatie eindigt

18.10.2024

Contactpersoon

Bruijn

Van loondienst naar zelfstandiger?

Ben je nog in vaste dienst, maar je wilt als zzp' er voor jezelf beginnen? Spannende beslissing! Wij helpen je graag bij de overstap van een vaste baan naar een zzp, freelance, interim of detachering opdracht!