Предупреждение: у нас есть цензура и предварительный отбор публикуемых материалов. Анекдоты здесь бывают... какие угодно. Если вам это не нравится, пожалуйста, покиньте сайт. 18+

История №1573046

Заблуждение о «взрыве данных»: почему Информационная Вселенная растёт не так быстро, как нам рассказывают

Введение: Телевизионный миф


В декабре 2025 года в одной из известных научно-популярных передач прозвучала ошеломляющая цифра: «За прошедший год объём мировой цифровой информации удвоился, достигнув величины, равной всему, что человечество накопило за предыдущие 45 лет!» Зрителям была представлена эффектная формула: если на 31 декабря 2024 года у нас было N зеттабайт данных, то к концу 2025-го стало 2N.

Как специалист в области данных и информатики, я услышал это и… задумался. А потом полез проверять. Оказалось, что реальная картина и сложнее, и в чём-то даже удивительнее этого медийного мифа. Давайте разберёмся, что на самом деле происходит с нашей цифровой Вселенной.

Часть 1: Что такое зеттабайт и как мы его считаем?


Прежде чем спорить о темпах роста, нужно понять масштаб. Зеттабайт (ЗБ) — это единица с 21 нулём. Один зеттабайт равен триллиону гигабайт. Чтобы его заполнить, потребовалось бы около 250 миллиардов стандартных DVD-дисков.

Оценкой глобального объёма данных занимаются авторитетные аналитические агентства, такие как IDC со своим проектом «DataSphere». Они не гадают, а анализируют мировые продажи серверных накопителей, трафик интернет-провайдеров, мощности дата-центров и активность пользователей. Их данные — это не красивая картинка для телевидения, а сложная экономико-технологическая модель.

Часть 2: Реальная, а не мнимая, статистика


Вот как на самом деле выглядела динамика роста мировой инфосферы (совокупности всех создаваемых, хранимых и потребляемых цифровых данных) в первой половине 2020-х:

· Конец 2022: 100–103 ЗБ
· Конец 2023: 120 ЗБ
· Конец 2024: 147–149 ЗБ
· Конец 2025 (прогноз/оценка): 181–182 ЗБ

Что мы видим? Устойчивый, мощный, но линейно-предсказуемый рост на 20–25% в год. Это означает, что за 2025 год мир добавил не фантастические N новых данных, а «всего лишь» около 0.22N (или 33–34 ЗБ). Общий объём к концу года составил 1.22N, а вовсе не 2N.

Часть 3: Почему «правило двух лет» устарело?


В 2010-х годах гулял мем: «90% всех данных создано за последние два года». Это было близко к истине в эпоху взрывного распространения смартфонов и соцсетей. Тогда темпы роста приближались к 50–60% в год, и удвоение действительно происходило примерно за два года.

Но любая экспонента рано или поздно упирается в физические и экономические ограничения. Нельзя ежегодно удваивать количество дата-центров, магистральных кабелей и фабрик по производству чипов. Рынок насыщается, а технологии хранения становятся эффективнее. Сегодня «правило двух лет» трансформировалось в «правило трёх с половиной – четырёх лет». Это признак зрелости цифровой экосистемы, а не её стагнации.

Часть 4: Откуда же взялся миф об удвоении?


Вероятнее всего, в передаче произошла классическая подмена понятий.

1. Данные vs. Трафик: Возможно, речь шла о глобальном интернет-трафике (всё, что передаётся по сетям). Один и тот же фильм, стримящийся миллионам зрителей, учитывается в трафике много раз. Это огромная, но «текущая» величина, а не постоянное хранилище.
2. Гипербола для ясности: Журналисты часто упрощают. Сравнение «сейчас за год создаётся больше, чем за всю историю» звучит эффектнее, чем «годовой прирост стабильно составляет 23%». Но именно второе утверждение — правда.

Часть 5: Что на самом деле движет ростом сегодня? (Главный сюрприз)


Если темпы в процентах снизились, то абсолютный прирост в зеттабайтах по-прежнему бьёт рекорды. И здесь главным драйвером с 2024 года стал генеративный искусственный интеллект.

ИИ — это не только потребитель, но и массовый производитель данных. Он генерирует:

· Синтетические датасеты для обучения новых моделей.
· Триллионы промежуточных результатов (чекпоинтов) в процессе своего обучения.
· Гигантские логи всех запросов и ответов.
· Новые виды контента (текст, код, изображения, видео), которые сами становятся сырьём для следующего цикла.

Мы вступили в эпоху автокаталитической инфосферы, где данные порождают ИИ, а ИИ, в свою очередь, порождает новые данные.

Часть 6: Что нас ждёт? Вызовы вместо погони за объёмом


Прогнозы на ближайшие годы реалистичны и основаны на текущих трендах:

· Конец 2026: ~221 ЗБ.
· Конец 2028: ~394 ЗБ.

Главный вызов смещается с вопроса «Как всё это хранить?» к вопросам:

· Как находить смысл в этом океане? (Развитие систем ИИ и анализа).
· Как делать это энергоэффективно? (Зелёные вычисления, оптимизация).
· Как обеспечивать безопасность и приватность? (Криптография, регулирование).

Заключение: Красота реальных чисел


История с телевизионным мифом — прекрасный урок. Реальная картина роста данных, пусть и не такая сенсационная, куда интереснее. Она показывает, как цифровая цивилизация проходит путь от юношеского взрывного роста к зрелой, сложной эволюции. Мы научились не просто производить информацию, но и управлять её жизненным циклом.

Следующий раз, услышав громкое заявление о «взрыве данных», стоит вспомнить простое правило: доверяй, но проверяй. А проверять лучше по данным тех, кто строит эту вселенную — инженеров и аналитиков. Их цифры, пусть и менее звучные, рисуют куда более грандиозную и правдивую картину нашего общего цифрового завтра.
+-5
Вовочка059
Послать донат автору/рассказчику
Проголосовало за – 41, против – 46
Статистика голосований по странам
Статистика голосований пользователей

Общий рейтинг комментаторов
Рейтинг стоп-листов