Нейросети. Выстрой свою систему из 5 уровней автоматизации - Казанцев Тимур
• Регионы с дефицитом энергии будут вынуждены ограничивать развитие ИИ-инфраструктуры или импортировать мощности.
• Крупные ИИ-компании уже заключают прямые контракты на поставку энергии и даже инвестируют в собственные энергетические проекты, включая атомную генерацию и SMR (малые модульные реакторы).
По сути, электричество становится тем, чем нефть была в XX веке – базой любой технологической гонки.
Если электричество – это «нефть», то GPU и дата-центры – это нефтяные вышки и НПЗ.
Сегодня рынок дата-центровых GPU растёт двузначными темпами, оценивается в сотни миллиардов долларов, и к 2030 году может практически удвоиться [8].
При этом на рынке специализированных чипов для ИИ (GPU, ускорители) доминирует NVIDIA, контролируя более 90% сегмента дата-центровых GPU в ключевых отчётах по 2024–2025 годам [9]. На этом фоне неудивительно, что NVIDIA недавно стала крупнейшей компанией в мире по рыночной капитализации, превысив отметку в 5 трлн долларов и обогнав предыдущих лидеров, вроде Apple и Microsoft.
Что это означает:
• Любая крупная компания, которая хочет обучать и запускать свои модели, оказывается в очереди за чипами.
• Пропускная способность этой «очереди» определяется не только деньгами, но и политикой экспортного контроля США и их союзников [10].
• NVIDIA фактически стала инфраструктурной компанией нового типа: она не продаёт конечный продукт пользователю, но контролирует критически важный слой – тот, через который проходит всё остальное.
Спрос настолько велик, что:
• компании строят целые дата-центровые кластеры под ИИ-сервера;
• капитальные затраты на ИТ-инфраструктуру (серверы, сети, системы хранения) занимают более 70–80% расходов на новые дата-центры [11];
• любая задержка в поставке GPU может стоить компаниям миллионы долларов упущенной выручки.
Война за GPU – это уже не метафора, а ежедневная реальность: топ-менеджеры договариваются о партиях чипов, как раньше договаривались о доступе к месторождениям.
На третьем уровне находятся модели – те самые большие языковые модели (LLM – large language models) вроде ChatGPT или Claude, Gemini, DeepSeek, QWEN, а также модели для работы с изображениями (которые “видят” и генерируют картинки и видео: Midjourney, Sora, VEO, Kling, NanoBanana и др), модели для звука (распознавание и синтез речи, музыка: ElevenLabs, Suno, и др) и мультимодальные модели, которые одновременно воспринимают и комбинируют текст, изображение, звук и иногда видео.
Чтобы обучить одну фронтирную модель:
• нужны тысячи GPU, работающих недели или месяцы;
• общий бюджет на обучение может превышать десятки-сотни миллионов долларов (учитывая железо, энергию, инженеров, инфраструктуру).
Но самое важное:
Модель – это кристаллизованное знание мира плюс стоимость всех вычислений, которые в неё вложены.
Отсюда вытекают ключевые черты:
• У единиц игроков есть ресурсы, чтобы строить модели мирового уровня (США, Китай, Россия, несколько крупных компаний).
• Остальные становятся пользователями моделей через API или используют открытые/местные варианты.
• Доступ к самым мощным моделям оказывается завязан на те самые GPU, электричество и политические решения наверху пирамиды.
Это похоже на ситуацию, когда определённое число стран контролирует производство самолётов, а все остальные покупают у них билеты.
Четвёртый уровень – это всё, что видит обычный человек:
• чат-боты, ассистенты, GPT-приложения;
• сервисы для маркетинга, дизайна, программирования, образования;
• голосовые помощники, аватары, системы поддержки клиентов.
Здесь происходит настоящее разнообразие и креатив:
• одни делают узкие решения под юристов, врачей, маркетологов;
• другие – системы, которые автоматизируют целые бизнес-процессы;
• третьи – инструменты для творчества и развлечения.
Но важно понимать: ни одно приложение не живёт само по себе.
Оно опирается:
• либо на API крупных моделей (OpenAI, Anthropic, Google, QWEN, локальные провайдеры);
• либо на самостоятельный развёрнутый стек (открытые модели + свои сервера).
Отсюда главный риск для разработчиков приложений:
«Ты строишь бизнес на чужой платформе. Если платформа поднимет цены или ограничит доступ – твой бизнес может исчезнуть за ночь».
И наоборот – отсюда же рождаются возможности:
Если ты понимаешь, как устроена инфраструктура, ты можешь проектировать такие приложения и системы, которые масштабируются, не убивая тебе маржу:
• заранее закладывать работу не с одной моделью, а с несколькими провайдерами;
• разделять “тяжёлые” задачи, которые действительно требуют дорогих мощных моделей, и “рутинные”, которые можно гонять через более простые и дешёвые решения;
• продумывать, что можно кэшировать, переиспользовать и считать локально, а не каждый раз оплачивать полный цикл обработки;
• строить ценовую модель продукта так, чтобы рост числа пользователей не превращал каждый новый запрос в удар по вашему же кошельку.
В результате вы делаете не красивую игрушку на модной нейросети, а систему, которая выдерживает и рост нагрузки, и изменения тарифов, и очередной виток гонки за мощностями.
На вершине – мы с вами:
• предприниматели, специалисты, фрилансеры, студенты;
• компании, которые внедряют ИИ в процессы;
• государства, которые перестраивают сервисы, налоговые системы, образование.
По данным Всемирного экономического форума, уже сейчас около 34% бизнес-задач в среднем выполняется машинами, а оставшиеся 66% – людьми [12]
Конец ознакомительного фрагмента.
Текст предоставлен ООО «Литрес».
Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
Похожие книги на "Нейросети. Выстрой свою систему из 5 уровней автоматизации", Казанцев Тимур
Казанцев Тимур читать все книги автора по порядку
Казанцев Тимур - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки mir-knigi.info.