S rýchlym vývojom v oblasti umelej inteligencie Meta spustila novú paradigmu, ktorá si vyžaduje vysoký technický výkon, aby fungovala efektívne. Ak sa pýtate, či vaše zariadenie zvládne tento model, je dôležité oboznámiť sa s potrebnými technickými požiadavkami. Tento článok vysvetľuje špecifikácie, ktoré vaše zariadenie potrebuje, a ako zlepšiť jeho výkon, aby ste s novým modelom mohli bezproblémovo pracovať.
Meta vydala Llama 3.3 70B, upravenú verziu najvýkonnejšieho modelu AI spoločnosti, ktorú si môžete stiahnuť a spustiť na svojich vlastných zariadeniach. Ale váš počítač na to pravdepodobne nie je pripravený.
Rovnako ako mnoho iných veľkých jazykových modelov, aj generatívny model AI spoločnosti Meta Llama je dostupný v niekoľkých veľkostiach parametrov pre rôzne prípady použitia. Napríklad najmenší model Llama 3.2 1B zvládne základné úlohy s rýchlym výkonom na priemernom smartfóne, zatiaľ čo väčšie verzie 11B a 90B sú výkonnejšie a vyžadujú špičkové počítače a servery. Modely Llama sú navrhnuté predovšetkým pre funkcie textu a chatu, ale niektoré verzie dokážu porozumieť aj obrázkom.
Nový model Llama 3.3 70B od spoločnosti Meta má ponúknuť rovnaký výkon ako najväčší model spoločnosti, verzia 405B, ale so schopnosťou bežať na viacerých počítačoch a serveroch. „Využitím najnovších pokrokov v technológiách po tréningu vrátane optimalizácie preferencií online tento model zlepšuje základný výkon pri oveľa nižších nákladoch,“ uviedol viceprezident spoločnosti Meta pre generatívnu AI v príspevku na sociálnych médiách.
Aj keď bol tento nový model 70B výrazne zmenšený oproti pôvodnej verzii 405B, stále budete potrebovať výkonný počítač alebo server, aby ste ho spustili lokálne s prijateľným výkonom. Veľkosť súboru je 37.14 GB a zariadenia LLM vo všeobecnosti potrebujú mať RAM, aby dobre fungovali, takže pravdepodobne budete potrebovať zariadenie so 64 GB RAM. Na spustenie modelu budete potrebovať aj výkonný GPU (alebo niekoľko spojených dohromady).
V popise modelu sa uvádza: „Llama 3.3 je určená na komerčné a výskumné použitie v niekoľkých jazykoch. Textové modely ladené podľa pokynov sú určené na chat podobný asistentovi, zatiaľ čo predtrénované modely možno prispôsobiť rôznym úlohám generovania prirodzeného jazyka. Model Llama 3.3 tiež podporuje schopnosť využiť výstup svojich modelov na zlepšenie iných modelov vrátane generovania syntetických údajov a destilácie.
Hoci Llama 3.3 70B nepobeží na väčšine počítačov, menšie 1B, 3B a 8B si zahráte na mnohých stolných počítačoch a notebookoch s aplikáciami ako LM Studio alebo Chat Nvidia s RTX. Môj 1GB Mac Mini M16 beží Llama 3.1 8B rýchlosťou podobnou cloudovému chatovaciemu softvéru, ale s 3GB MacBookom Air používam menšie 8B modely, keďže mám k dispozícii menej pamäte RAM.
Llama 3.3 70B a ďalšie modely Lama si môžete stiahnuť z Meta webو وObjímajúca tvára vstavané vyhľadávanie v LM Studio a iných úložiskách.
Tiež: TechCrunch



