Google насочва Gemini отвъд ролята на чатбот. Компанията развива AI помощник, който може да вижда екрана, да използва камерата, да помни контекст и да изпълнява задачи с ограничена човешка намеса.

Посоката беше описана от Google DeepMind на 20 май 2025 г. Тогава компанията заяви, че иска Gemini да стане „универсален AI асистент“. През май 2026 г. Google разшири и инструментите за агенти в Gemini API.

Ключовата промяна е, че Google изгражда не просто модел за отговори, а софтуер, който планира, действа и изпълнява задачи вместо потребителя.

Какво обяви Google

На Google I/O на 20 май 2025 г. компанията обедини няколко проекта в обща стратегия.

  • Gemini Live получи функции за камера и screen sharing.
  • Project Astra беше представен като основа за асистент, който разбира света в реално време.
  • Project Mariner показа как агент може да управлява браузър и да изпълнява многостъпкови задачи.

В официалния блог на Google DeepMind главният изпълнителен директор Демис Хасабис заяви, че целта е Gemini да разбира контекста, да планира и да действа от името на потребителя на различни устройства.

Къде е съществената промяна

Промяната не е само в по-добрия разговор с AI. Google се движи към модел на постоянен помощник, който може да се включва чрез глас, камера, екран или браузър.

Има и важни ограничения. Според документацията на Google за Gemini Live камерата и screen sharing не остават постоянно активни. Ако телефонът бъде заключен, споделянето на екрана спира. Ако потребителят напусне мобилното приложение, камерата се изключва и не се включва автоматично при връщане.

Това означава, че стратегията е ясна, но масов напълно автономен режим на потребителски устройства още не е налице. Google постепенно разширява самостоятелните действия на Gemini, но в рамки, които все още се настройват.

Кои продукти движат стратегията

  • Gemini Live, за разговор, камера и screen sharing.
  • Project Astra, за визуално разбиране, памет и мултимодален контекст.
  • Project Mariner, за управление на браузър и изпълнение на уеб задачи.
  • Managed Agents в Gemini API, обявени на 19 май 2026 г., за агенти, които работят в защитена cloud среда.

Последният елемент показва, че Google гледа отвъд телефона. При Managed Agents компанията предлага агент, който разсъждава, използва инструменти и изпълнява код в изолирана Linux среда.

Какво означава това за България

Темата има пряко значение и за българските потребители. Ако Google наложи този модел в Android, Chrome, Search и Workspace, това ще промени начина, по който хората търсят информация, пишат имейли, резервират услуги и работят с документи.

Най-прекият ефект ще се усети в няколко области:

  • в офиса, където AI агент може да поеме рутинни задачи;
  • в малкия бизнес, където един помощник може да замести част от административната работа;
  • в сигурността и личните данни, защото по-активният асистент получава повече достъп до съдържание и действия.

Това е и основният спор около технологията. Колкото по-полезен става агентът, толкова повече достъп иска до екрана, файловете, браузъра, приложенията и историята на задачите.

Къде са рисковете

Контролът остава ключов въпрос. Агент, който изпълнява многостъпкови действия, може да спести време. Може и да допусне грешка, ако резервира, изпраща, поръчва или попълва формуляри вместо потребителя.

Личните данни са вторият голям риск. Google посочва, че при включена активност в Gemini Apps могат да се съхраняват стенограми от Live разговори, аудио, изображения, файлове и съдържание, което потребителят споделя.

Има и риск от по-силна зависимост от екосистемата на Google. Колкото повече Gemini се свързва с Android, Chrome, Search и приложенията на Google, толкова по-трудно става отказът от тази среда.

Какво следва

Google още не предлага напълно самостоятелен масов AI агент, който да работи непрекъснато на всеки телефон без условия. Но от май 2025 г. насам компанията последователно подрежда продуктите си около една цел.

Залогът вече не е само кой има по-добър чатбот. Състезанието се измества към това кой ще контролира помощника, който действа вместо човека. Ако Google успее, Gemini може да се превърне в основен посредник между потребителя и голяма част от ежедневните дигитални задачи, според обявеното от Google и Google DeepMind.