Gemma a Google open source modellje

2024. február 26. by Bíró Gábor

A Google bemutatta a Gemma nevű új open-source mesterséges intelligencia modellcsaládját. A Gemma modellek a Google zászlóshajójának számító Gemini modellekkel azonos kutatáson és technológián alapulnak, így kínálva egy state of the art elérhető alternatívát fejlesztőknek és kutatóknak.

A "state of the art" kifejezés az adott területen elérhető legfejlettebb technológiát, módszert vagy terméket jelenti, amely a jelenlegi legmagasabb színvonalat képviseli.

Gemma modellek kulcsjellemzői

Modell változatok: A Gemma modellek két méretben érhetőek el: Gemma 2B és Gemma 7B, mindkettő előre betanított és instrukcióval hangolt változatban. Ezek a modellek úgy vannak tervezve, hogy könnyűek legyenek és futtathatók legyenek egy fejlesztő laptopján vagy asztali számítógépén, így széles körű alkalmazásokhoz hozzáférhetőek.

a "2B" és "7B" kifejezések a modell méretét jelzik, pontosabban a modell paramétereinek számát. A "B" itt milliárdot jelent, tehát egy "7B" modell körülbelül 7 milliárd paraméterrel rendelkezik, míg egy "2B" modell körülbelül 2 milliárd paramétert tartalmaz. Ezek a paraméterek a modell súlyai, amelyek a tanulási folyamat során kerülnek optimalizálásra, és azt határozzák meg, hogy a modell hogyan hajtja végre a feladatokat, például a nyelvfeldolgozást vagy képgenerálást. Minél nagyobb a paraméterek száma, annál jobb a modell teljesítménye a különböző feladatokban.

Keresztplatform és keretrendszer kompatibilitás: A Gemma modellek több keretrendszeres eszközöket támogatnak és kompatibilisek különböző eszközökön, beleértve a laptopokat, asztali számítógépeket, IoT eszközöket, mobilokat és felhő platformokat. Ezek optimalizáltak az NVIDIA GPU-kon és a Google Cloud TPU-kon való teljesítményre, biztosítva széleskörű hozzáférhetőséget és iparági vezető teljesítményt.
Felelős AI eszközkészlet: A Gemma modellek mellett a Google kiadott egy Felelős Generatív AI Eszközkészletet is. Ez az eszközkészlet útmutatást és eszközöket nyújt a fejlesztők számára a biztonságosabb AI alkalmazások létrehozásához, hangsúlyozva a felelős használatot és innovációt.
Nyílt modell filozófia: A hagyományos open-source modellekkel ellentétben, a Gemma modellek olyan felhasználási feltételekkel érkeznek, amelyek a felelős kereskedelmi használatot és terjesztést teszik lehetővé. Ez az megközelítés az open hozzáférés előnyeinek és a visszaélés kockázatainak csökkentésének szükségességét kívánja egyensúlyozni.

Alkalmazások és hozzáférhetőség

A Gemma modellek számos nyelvi alapú feladatra lettek tervezve, mint például szöveg generálás, összefoglalás és chatbotok. Különösen alkalmasak azokra a fejlesztőkre, akik kisebb, költséghatékonyabb modellekben keresik az állapot-árt-technikai teljesítményt. A Google állítása szerint a Gemma modellek, méretük ellenére, jelentősen felülmúlják a nagyobb modelleket kulcsfontosságú benchmarkokon.

A fejlesztők és kutatók a Gemma modellekhez hozzáférhetnek olyan platformokon keresztül, mint a Kaggle, Hugging Face, NVIDIA NeMo és a Google Vertex AI. A Google ingyenes hozzáférést biztosít a Gemmához a Kaggle-on, ingyenes tier-t a Colab notebookokhoz, és 300 dollár hitelt az első alkalommal Google Cloudot használó felhasználóknak, a kutatók pedig akár 500 000 dollár Google Cloud hitelre lehetnek jogosultak.

A Gemma és a Gemini modellek összehasonlítása

Hozzáférhetőség és használat:
- Gemini: A végső felhasználók számára webes és mobilalkalmazásokon, API-kon és a Google Vertex AI platformján keresztül érhető el, elsősorban zárt modellhasználathoz.
- Gemma: Fejlesztők, kutatók és vállalkozások számára készült, kísérletezéshez és integrációhoz, nyíltan hozzáférhető és terjeszthető.
Modell méret és képességek:
- Gemini: Nagyobb zárt AI modell, összetett feladatokra, mint például a ChatGPT, alkalmas.
- Gemma: Könnyű nyílt modellek, két méretben (2B és 7B) elérhetőek, kisebb feladatokra, mint chatbotok vagy összefoglalás optimalizálva, felülmúlva a nagyobb modelleket kulcsfontosságú benchmarkokon.
Telepítés és kompatibilitás:
- Gemini: Általában specializált adatközponti hardvereket igényel a telepítéshez.
- Gemma: Laptopokon, munkaállomásokon vagy a Google Cloudon futtatható, könnyen telepíthető olyan platformokon, mint a Vertex AI és a Google Kubernetes Engine, különböző eszközökön optimalizálva, beleértve az NVIDIA GPU-kat és a Google Cloud TPU-kat.
Licencelés és filozófia:
- Gemini: Zárt modell korlátozott hozzáféréssel.
- Gemma: Nyílt modell, amelynek felhasználási feltételei lehetővé teszik a felelős kereskedelmi használatot és terjesztést, hangsúlyozva a nyílt hozzáférés és a kockázatcsökkentés közötti egyensúlyt.

A Google stratégiai váltása

A Gemma kiadása egy stratégiai váltást jelent a Google részéről az open-source AI modellek felé való nyitásban. Ezt a lépést válaszként tekintik a hozzáférhető, magas minőségű AI modellek iránti növekvő igényre, és egy módnak az AI közösségen belüli innováció és együttműködés elősegítésére. A Gemma modelljeit nyílt modellekként kínálva a Google célja, hogy felhatalmazza a fejlesztőket és kutatókat a technológiájának továbbépítésére, miközben fenntartja elkötelezettségét a felelős AI fejlesztés iránt.