Vážení čtenáři, ve spolupráci s Pavlem Klocem ze společnosti AUTODIAGNOSTIKA KLOC, s.r.o., pro vás připravujeme seriál, ve kterém se exkluzivně dozvíte aktuální informace o vývoji, nasazení a využití nejnovější technologie z oblasti umělé inteligence v automobilovém průmyslu. V tomto dílu pokračujeme v tématu AI gramotnosti. Příště se ponoříme nejen do skutečné analýzy a vizualizace diagnostických dat pomocí gen AI nástrojů, ale otevřeme i další téma z kompletního kurzu „AI v automotive“ na DiagAcademy.
Obsah článku:
- Jak AI „čte“
- Rozdíl mezi špatným a dobrým dotazem v praxi
- Špatný přístup (demonstrace regrese výkonu)
- Dobrý přístup (stanovení hypotézy s pokročilým modelem)
- Desatero pro práci s kontextovým oknem
Jak AI „čte“
Každý chat, který s AI vedete, je jako samostatná instance. S každým dalším dotazem neposíláte jen novou otázku, ale celou předchozí historii konverzace, tzn. své dotazy i odpovědi modelu. Čím déle tedy konverzace trvá, tím více tokenů musí model při každé odpovědi znovu zpracovat a tím rychleji se blížíte k limitu jeho kontextového okna.
Nejlepší praxí je proto dělit konverzace podle témat a úkolů a používat krátké, soustředěné chaty pro konkrétní výstupy. V pokročilejších aplikacích se pro správu kontextu používají techniky jako windowing (model pracuje jen s několika posledními zprávami) nebo sumarizace, kdy AI shrne předchozí části konverzace a s tímto zhuštěným obsahem pracuje dál. To šetří tokeny a udržuje konverzaci relevantní.
Regrese výkonu při práci s rozsáhlým kontextem je sice kritický, ale zdaleka ne jediný faktor ovlivňující kvalitu výstupu, například při generování diagnostických hypotéz. V naší „mapě AI gramotnosti“ (viz obr. 20 ve čtvrtém dílu seriálu) definujeme na úrovni 1 další fundamentální znalosti, jejichž zvládnutí je pro dosahování konzistentních a spolehlivých výsledků nezbytné. Mezi klíčové aspekty patří:
• Omezení a výkonnostní stropy modelů: Neplacené verze často trpí přísným omezováním počtu dotazů za časovou jednotku (tzv. rate limiting) a bývají záměrně „přiškrceny“ na nižší výpočetní výkon.
• Kognitivní výkonnost modelu: Různé verze modelů (bezplatné vs. placené) se liší nejen délkou kontextového okna, ale i „IQ“, tedy schopností rozvíjet smysluplné hypotézy a analytické úvahy na základě jejich schopnosti usuzování (reasoning), kreativity a přesnosti, které se měří pomocí standardizovaných benchmarků. Platí jednoduché pravidlo: čím vyšší IQ modelu, tím inteligentnější návrhy můžete očekávat. Je logické, že pro komplexní analýzu hledáte partnera s co nejvyššími kognitivními schopnostmi.
• Multimodalita a specializace: Pokročilé modely umožňují kombinovat více formátů vstupních dat. V praxi to znamená, že jako vstup pro získání diagnostické hypotézy nebo konzultace můžete současně přiložit výpis závad, technická data, dílenskou příručku, TPI, fotografii poškozeného dílu či CSV logy. Schopnost zpracovat tolik dat v jednom kroku s poměrně vysokým IQ zásadně mění hru.
Tyto faktory spolu silně korelují a ignorovat kterýkoliv z nich vede k nespolehlivému výsledku. Velikost kontextového okna je velmi důležitá, ale pokud se obrátíte na „levnější, polovičně slepý“ model, bude mít menší perspektivu bez ohledu na to, kolik tokenů mu dopřejete. V naší srovnávací tabulce proto najdete i tyto metriky, aby bylo zřejmé, proč placené verze – s vyšším „IQ“, širší multimodalitou a volnějšími limity – přinášejí diametrálně odlišné, použitelné výstupy.
Pokud Vás článek zaujal a přejete si pokračovat v jeho přečtení, přihlaste se.
Tento článek je přístupný pouze pro předplatitele
Máte už předplatné? Přihlásit se.