Veřená zakázka
Vývoj datové pipeline pro AI-driven analýzu HoReCa dat – Datový inženýr
IT -> SW a Informační systémy
Předmětem zakázky je návrh a implementace datové pipeline a cloudové infrastruktury pro platformu sloužící k automatizovanému sběru, transformaci a ukládání dat z webových zdrojů napojených na aktivní HoReCa podniky v Evropě.
Konkrétní rozsah plnění zahrnuje:
- Návrh a implementace škálovatelné datové pipeline (Apache Airflow / PySpark nebo ekvivalentní technologie).
- Integrace s cloudovými platformami a databázovými řešeními (GCP, Azure, MongoDB nebo ekvivalentní).
- Implementace scrapingové infrastruktury pro sběr dat z HoReCa webových zdrojů.
- Transformace získaných dat do tabulkového formátu a párování do globálního číselníku.
- Základní dokumentace implementované infrastruktury.
Odhadovaný rozsah prací: cca 300–375 hodin / 6–8 týdnů.
-
calendar_todayDatum zahájení zakázky:17.06.2026
-
calendar_todayLhůta pro podání nabídek do:30.06.2026