
Google dnes oznámil čtyři nové smartphony z řady Pixel 9, nové hodinky Pixel Watch poprvé ve dvou velikostech a nová sluchátka Pixel Buds. Zatímco hardware zní jako nabitý večerní program, skutečná hvězda je úplně jiná: Gemini – a zejména Gemini Live. Je to okamžik přistání na Měsíci pro umělou inteligenci?
Co jsou Blíženci – a jak daleko mohou zajít?
Vraťme se o krok zpět: Google sdružuje pod záštitou Gemini poněkud nepřehledné množství různých věcí. Na jedné straně jsou to generativní modely AI Gemini Nano, Gemini Flash, Gemini Pro a Gemini Ultra. Tyto modely postupují ve vzestupných verzích; nejvýkonnějším modelem je v současnosti „Gemini 1.5 Pro“, který v různých benchmarcích AI překonává konkurenci od OpenAI & Co.
Gemini se však od začátku roku 2024 také nazývá chatbot společnosti Google, dříve známý jako Bard. A tento chatbot nyní dostává jazykovou verzi s názvem „Gemini Live“ ve stylu legendárního hlasového režimu ChatGPT 4o, který byl oznámen. jeden den před Google I/O v květnu 2024. Stále není k dispozici ani jako široká beta verze, takže titulky se objevují spíše kvůli děsivým selháním než kvůli překvapivému vzhledu.
Mimochodem, Gemini také odkazuje na různé modely předplatného. Samotný „Gemini“ je bezplatný přístup k Google AI s názvem Gemini na základě modelu „Gemini Pro“. Přístup k výše uvedenému „Gemini 1.5 Pro“ však máte pouze s modelem předplatného „Gemini Advanced“ za 19,99 $ měsíčně – nebo si můžete předplatit Google One AI Premium. S Gemini Business v tuto chvíli ani nezačnu. Ale teď k předpokládanému přistání na Měsíci.
- Přečtěte si více: Google Pixel Watch 3 – jak velký je rozdíl oproti Watch 2?

Čtyři barevné tečky Asistenta Google budou brzy historií – nyní přichází „Věk blíženců“. / © Google
Gemini Live: „Hvězda“ show
Kromě čtyřiatřiceti různých Blíženců existuje další stejnojmenný rys, který ukazuje cestu do příštích let: Gemini Live. Jedná se o takzvaný konverzační model, který umožňuje přirozené konverzace – spíše než pouhou výměnu tahových hlasových zpráv s modelem AI, z nichž každá je přepsána jako text nebo výstup prostřednictvím hlasového výstupu. Rozdíl v dynamice je jako srovnávat šachy se sprintovým závodem.
V živém demu na akci „Made by Google“ požádala Jenny Blackburn o zábavnou a vzdělávací aktivitu pro svou neteř a synovce v oblasti chemie, včetně doteku magie. Návrhy byly kouzelná sopka, podomácku vyrobená lávová lampa nebo neviditelný kouzelný inkoust.
Jenny si vybrala kouzelný inkoust, který se v průběhu následující konverzace vyvinul do černého inkoustu, dostal název projektu „Secret Message Lab“ a záruku, že při experimentování nenadělá příliš mnoho nepořádku.
Méně než čistý výsledek, který by se dal snadno vygooglovat, byla opravdu působivá cesta. S Gemini Live se internet stane vaším partnerem pro konverzaci – a v budoucnu také vaším vlastním životem, který lze nyní také vyhledávat pomocí Gemini AI díky několika novým funkcím.
Funkce „Call Notes“ například přepisuje vaše telefonní hovory po nápovědě pro vašeho partnera v konverzaci a umožňuje vám v nich následně vyhledávat. „Pixelové snímky obrazovky“ přemění vaši opomíjenou sbírku snímků obrazovky údajně důležitých věcí na prohledávatelnou databázi osobních poznámek. A s rozšířeními Workspace Extensions můžete mluvit se svým Kalendářem Google a také s daty z e-mailů, úkolů nebo Google Keep.
„Problém“: Gemini Live vyžaduje výkonný jazykový model Gemini 1.5 Pro, který běží v cloudu. Pokud používáte modely umělé inteligence k extrahování podrobností ze svého vesmíru osobních dat Google Workspace, přepisů atd., provádí se to pouze lokálně – pomocí Gemini Nano. U cloudového Gemini 1.5 Pro však existuje obrovská mezera v ochraně dat. Požádali jsme Google o vyjádření k této záležitosti a aktualizujeme článek, jakmile obdržíme zpětnou vazbu.

Na základě vyfoceného koncertního plakátu a Google kalendáře říká AI asistent Gemini, zda má uživatel čas jít na koncert. / © Google
Gemini a mezera v ochraně dat
Zatímco Gemini, latinsky „dvojče“, ve skutečnosti znamená partnerství mezi dvěma laboratořemi společnosti Google pro umělou inteligenci, DeepMind a Brain, název by také mohl být chápán jako nedobrovolný popis rozdělení mezi místními cloudy.
Jednoduše řečeno: Pokud začnete chatovat s Gemini Live v angličtině v aplikaci Gemini pro Android (ano, aplikace se tak samozřejmě jmenuje), zde běžící model AI nemá přístup k vašim osobním údajům z vašeho e-mailu, kalendáře atd. A to se pravděpodobně nezmění, až bude Gemini Live v nadcházejících týdnech a měsících k dispozici v jiných jazycích a dokonce i pro iOS.
Pokud se chcete Blíženců zeptat, zda se můžete zúčastnit koncertu podle fotografie plakátu, musíte svůj dotaz napsat jako v době kamenné nebo použít hlasový vstup. Protože ačkoli lokálně běžící model Gemini Nano má přístup k vašim osobním údajům, nemá dostatek energie pro konverzace v reálném čase.
- Také zajímavé: Google Pixel 9, Pixel 9 Pro (XL) a Pixel 9 Pro Fold ve srovnání

Čip Google Tensor G4 v nové řadě Pixel 9 má dostatek výkonu pro provoz modelu Gemini Nano AI na zařízení. / © Google
Přistávají Gemini Live the Moon v „AI Race“?
Ve vesmírném závodě 60. a 70. let měla NASA vesmírný program nazvaný „Gemini“, který připravil cestu pro první přistání na Měsíci v roce 1969 s následným programem Apollo. Náhoda? Sotva, protože deset hlasů dostupných pro Gemini Live při startu dostalo anglické názvy pro hvězdná souhvězdí: Vega, Dipper, Ursa & Co.
Takže zatímco Google sahá ke hvězdám a na své afterparty má na pódiu i bývalého inženýra NASA, k přistání na Měsíci stále chybí jeden kousek. Pečlivě vytvořené spojení mezi nejsoukromějšími uživatelskými daty v lokálně běžících modelech Gemini a výkonnými cloudovými modely, které umožňují přirozeně vypadající konverzace.
Google již oznámil další krok s Projectem Apollo Astra: Zde má Gemini Live získat přístup ke kameře, jak již bylo ukázáno na Google I/O, a poté také postupně integrovat aplikace, jako je Kalendář Google.