Veřená zakázka
Nalezení jednoho dodavatele služeb pro vývoj AI platformy
IT -> SW a Informační systémy
Předmět poptávky zahrnuje zejména: GPU Infrastruktura a Model Serving: Provozování lightweight GPU instancí (T4/L4) pro lokální hostování modelů. Implementace nástroje vLLM pro paralelní obsluhu embedding modelu (multilingual-e5-large) a velkých jazykových modelů (Gemma 3 12B / Llama 3.1 8B). Vývoj REST API pro dávkové i jednotlivé generování embeddingů s mechanismy health checks a automatického škálování. Vektorové vyhledávání a DB vrstva: Implementace pgvector v rámci PostgreSQL pro ukládání a prohledávání vektorových reprezentací dat. Vývoj hybridního skórovacího systému kombinujícího kosinovou podobnost s tvrdými filtry Architektonická příprava pro budoucí migraci na dedikovanou vektorovou databázi Qdrant. AI Scraping Engine a normalizace: Integrace s platformou Apify pro sběr desetitisíců z internetu Využití self-hosted LLM pro extrakci entit a překlad (CZ-EN) v rámci jednoho inferenčního volání s využitím JSON mode a Zod schémat pro garantovanou strukturu výstupu. Implementace deduplikačního mechanismu "Gatekeeper" využívající algoritmy SimHash/MinHash pro fingerprinting inzerátů. Pipeline pro zpracování vložených pdf dat: Systém pro extrakci textu z PDF/DOCX formátů s implementovaným OCR fallbackem. Automatizovaná detekce jazyka a strukturování nestrukturovaných dat z dokumentu do definovaných JSON objektů pomocí lokálního LLM.11 Logika pro automatický přepočet embeddingů ze strukturovaných dat při změně dat a bezpečnostní limity pro frekvenci aktualizací. AI Matching a Reasoning: Vícesložkový model shody (multi-score model) zahrnující shodu třech skupin informací. Generování textového odůvodnění shody prostřednictvím externích API (OpenAI / Anthropic). Tři různé kategorie reasoningu. Komplexní systém cachování výsledků v Redis využívající SHA256 hashe (User_ID + Item_ID + Profile_Hash) s 30denní platností. Asynchronní zpracování a orchestrace: Využití Redis a BullMQ pro správu a prioritizaci front asynchronních úloh (např. scraperu). Implementace nočního plánovače (cron job) pro synchronizaci expirací položek a hromadné čištění databáze. Aplikační Core a Bezpečnost: Vývoj v např. Next.js monorepu s integrací self-hosted autentizačního frameworku BetterAuth. Implementace e-mailových workflow (verifikace, reset hesla) přes AWS SES. Typově bezpečné mezinárodní prostředí pomocí ParaglideJS pro snadnou lokalizaci.20 Vývoj probíhající od května do června, Odhad 60 MDs Výsledek společného vývoje zůstane ve výhradním vlastnictví zadavatele.
-
calendar_todayLhůta pro podání nabídek do:03.05.2026