V dnešnej epizóde tohto mikropodcastu som sa rozhodol hovoriť o pipeline-och.
Pipeline v kontexte informačných technológií je sled procesov, kedy výstup z jednej časti vstupuje do ďalšej časti v poradi. Takto týchto častí môže byť aj niekoľko za sebou. Tento proces sa používa na to, aby buď transformovali data alebo presúvali softver z formy kódu až do formy funkčného stavu, ktorý sa dostane priamo k zákazníkovi.
Motiváciou pre hovor o pipeline-och je práve tento mikropodcast lomitko blog, ktorý som vyskladal taktiež na báze pipeline. Ako tento sled funguje, sa pokúsim opísať.
Nahrávanie a transformácia a formátovanie
Proces začína tým, že tento mikropodcast nahrávam. Nasledne sa použije model nazývaný Whisper, ktorý prevádza nahrané slova do textu. Tento model je dostatočne dobrý aj pre slovenský text a funguje celkom kvalitne.
Tretí krok v tejto pipeline je, že iný model vezme textovú reprezentáciu nahrávky a pridá do nej odstavce na zrozumiteľné miesta. Tento formátovaný text sa potom vloží do šablóny vo formáte workdown, ktoré je verejně dostupný a podporovaný.
Konzistentnosť a uloženie do repozitáru
Ďalší krok je, že takto vyprodukovaný šablonu sa dodatočne formátuje, aby všetky šablóny vyzerali konzistentne. To znamená, že upraví sa dĺžka riadku a podobne. Doplňujú sa chybajúce medzery alebo riadky.
Tento text sa uloží do repozitáru, ktorý je miestom, kde sa ukladá kód. V mojom prípade je to Github. V tomto kroku sa vyšle signál v prípade, že sa do repozitáru nahrá nový obsah.
Generovanie a distribúcia
Tento signál zavolá ďalší krok procesu, ktorý z Markdownu vytvorí statickú stránku. Na toto sa používa nástroj nazývaný Zola. Výhodou statických stránok je ich rýchlosť načítania a dostupnosť na väčšine zariadení.
Posledný krok je, že takto vyprodukovaná statická stránka sa nahrá do distribučnej siete, aby bola verejne dostupná na adrese peterbapic.sk. V tomto prípade sa pre distribučnú sieť používa Cloudflare.