Исследователи из Китая и Канады представили новую концепцию сжатия данных с использованием искусственного интеллекта под названием LMCompress. Этот подход предполагает, что эффективность сжатия может значительно возрасти, если алгоритм понимает содержание информации так же, как это делает человек.
Современные пользователи постоянно обмениваются большими объёмами данных — текстами, изображениями, видео — и нуждаются в способах ускорить их передачу без потери качества. Ведущий автор исследования, Минг Ли, объясняет: «Если человек хорошо разбирается в теме, он может передать её суть в сжатой форме. Наш подход работает по аналогичному принципу, только с помощью больших языковых моделей (LLM)».
LMCompress основывается на идее, предложенной ещё в 1948 году математиком Клодом Шенноном: при понимании сути информации её можно передавать эффективнее. Однако только с появлением ИИ-моделей, способных предсказывать содержание, эта концепция обрела практическое воплощение.
В рамках проекта исследователи продемонстрировали, что нейросети, обученные на больших массивах данных, способны восстанавливать исходную информацию с высокой точностью. Это открывает возможность не передавать весь массив данных напрямую — достаточно сжать его до уровня, при котором модель сможет корректно восстановить его у получателя. Согласно испытаниям, LMCompress удваивает показатели сжатия по сравнению с классическими алгоритмами при работе с текстами, изображениями и аудио. В случае с видео эффективность оказалась чуть ниже, но также значительной.
Исследователи считают, что их работа открывает новую главу в развитии технологий передачи данных. Такие алгоритмы могут вытеснить традиционные решения и стать стандартом для всех цифровых устройств.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Ключ приложения GIPHY не установлен. Пожалуйста, проверьте настройки