V dnešnej epizóde tohto mikropodcastu som sa rozhodol hovoriť o pipeline-och.

Pipeline v kontexte informačných technológií je sled procesov, kedy výstup z jednej časti vstupuje do ďalšej časti v poradi. Takto týchto častí môže byť aj niekoľko za sebou. Tento proces sa používa na to, aby buď transformovali data alebo presúvali softver z formy kódu až do formy funkčného stavu, ktorý sa dostane priamo k zákazníkovi.

Motiváciou pre hovor o pipeline-och je práve tento mikropodcast lomitko blog, ktorý som vyskladal taktiež na báze pipeline. Ako tento sled funguje, sa pokúsim opísať.

Nahrávanie a transformácia a formátovanie

Proces začína tým, že tento mikropodcast nahrávam. Nasledne sa použije model nazývaný Whisper, ktorý prevádza nahrané slova do textu. Tento model je dostatočne dobrý aj pre slovenský text a funguje celkom kvalitne.

Tretí krok v tejto pipeline je, že iný model vezme textovú reprezentáciu nahrávky a pridá do nej odstavce na zrozumiteľné miesta. Tento formátovaný text sa potom vloží do šablóny vo formáte workdown, ktoré je verejně dostupný a podporovaný.

Konzistentnosť a uloženie do repozitáru

Ďalší krok je, že takto vyprodukovaný šablonu sa dodatočne formátuje, aby všetky šablóny vyzerali konzistentne. To znamená, že upraví sa dĺžka riadku a podobne. Doplňujú sa chybajúce medzery alebo riadky.

Tento text sa uloží do repozitáru, ktorý je miestom, kde sa ukladá kód. V mojom prípade je to Github. V tomto kroku sa vyšle signál v prípade, že sa do repozitáru nahrá nový obsah.

Generovanie a distribúcia

Tento signál zavolá ďalší krok procesu, ktorý z Markdownu vytvorí statickú stránku. Na toto sa používa nástroj nazývaný Zola. Výhodou statických stránok je ich rýchlosť načítania a dostupnosť na väčšine zariadení.

Posledný krok je, že takto vyprodukovaná statická stránka sa nahrá do distribučnej siete, aby bola verejne dostupná na adrese peterbapic.sk. V tomto prípade sa pre distribučnú sieť používa Cloudflare.