Google и Intel пренареждат пазара на AI инфраструктура. Конкуренцията вече не се води само при графичните процесори. Фокусът се измества към цената, енергийната ефективност, софтуера и контрола върху центровете за данни.

За бизнеса това означава по-широк избор. Означава и по-сложни решения при покупка на AI капацитет, особено в облака.

Ключовият въпрос вече не е само кой има най-бързия чип. Важни са и цената на inference, наличността и зависимостта от конкретна платформа.

Google разширява натиска с Ironwood

На 9 април 2025 г. Google представи Ironwood, седмо поколение Tensor Processing Unit. По данни на Google чипът е проектиран основно за inference, тоест за изпълнение на заявки към AI модели.

Компанията заяви, че Ironwood осигурява 10 пъти по-висока пикова производителност спрямо TPU v5p. Google посочи и над 4 пъти по-добра производителност на чип спрямо Trillium при training и inference.

Google обвърза Ironwood с платформата AI Hypercomputer. Тя включва изчислителни ресурси, мрежа, оркестрация и софтуер за големи AI натоварвания. Така компанията предлага не само чип, а цялостна инфраструктурна среда.

  • по-малка зависимост от външни доставчици на GPU
  • по-добър контрол върху разходите в облака
  • по-силен натиск при inference, където е големият обем от заявки

Това е важно за европейските клиенти, включително за компании в България. Много от тях купуват AI капацитет през облачни услуги, вместо да изграждат собствени клъстери. Ако големите облачни доставчици предлагат повече вътрешни ускорители, клиентите може да получат по-ниска цена или по-добра наличност. Рискът е по-силна обвързаност с една платформа.

Intel търси корпоративния пазар с Gaudi 3

Intel следва различен подход. Компанията позиционира ускорителя Gaudi 3 като по-достъпна алтернатива за AI натоварвания в предприятията.

През 2025 г. Intel разшири наличността на Gaudi 3 чрез сървърни партньори и облачни доставчици. IBM обяви наличност на Gaudi 3 в облака си във Франкфурт и Вашингтон.

По данни на Intel конфигурация с осем ускорителя Gaudi 3 предлага 128 гигабайта високоскоростна памет на ускорител. Компанията посочва и пропускателна способност на паметта от 3,7 терабайта в секунда. Това е насочено към големи езикови модели и компютърно зрение, където инфраструктурните разходи остават висок фактор.

  • по-ниска цена спрямо най-скъпите GPU системи
  • фокус върху корпоративни и хибридни среди
  • интеграция със стандартни сървъри и облачни партньори

Наличността на Gaudi 3 във Франкфурт има пряко значение за компании в ЕС. Това може да намали латентността и да улесни спазването на изискванията за местоположение на данните. За български фирми, които работят с чувствителни данни, това е практичен вариант.

Най-големият натиск е при inference

Пазарът дълго беше фокусиран върху обучението на големи модели. Сега вниманието се измества към inference. Причината е проста. Там се натрупват ежедневните разходи, когато потребители и компании изпращат голям брой заявки към AI системи.

Контролът върху inference инфраструктурата може да определи голяма част от бъдещите оперативни разходи при генеративния AI.

Това обяснява защо Google представя Ironwood като TPU за inference. Това обяснява и защо Intel продава Gaudi 3 като инструмент за мащабиране на AI на по-ниска цена. Двете компании атакуват един и същ пазарен проблем с различни стратегии.

Какво означава това за бизнеса в България

За компаниите в България изборът вече не е само между различни GPU оферти. Все по-често ще се сравняват цели AI среди.

  • цена на inference
  • наличност на капацитет
  • местоположение на данните в ЕС
  • съвместимост със съществуващ софтуер
  • риск от зависимост от един доставчик

Това увеличава конкуренцията и може да подобри условията за купувачите. Има и обратна страна. Колкото повече пазарът се разделя между TPU, GPU и други ускорители, толкова по-трудно става прехвърлянето на модели и натоварвания между различни платформи.

Основната промяна е, че AI инфраструктурата става по-широка и по-фрагментирана. Победителят няма да е само този с най-мощния ускорител. Решаващи ще бъдат цената, наличността, енергийната ефективност и софтуерната среда, според данните и позиционирането на Google, Intel и IBM.