MIT создала компактные ИИ-модели, которые превзошли коммерческие аналоги в анализе графиков

Ученые из Массачусетского технологического института (MIT) представили компактные модели искусственного интеллекта, которые научились понимать графики и диаграммы. По данным источника, эти модели оказались точнее, чем крупные коммерческие аналоги, при значительно меньшем размере.
Разработка направлена на решение задачи автоматического анализа визуализаций данных, которая долгое время оставалась вызовом для ИИ. Традиционные большие нейросети часто путают типы графиков, неправильно считывают значения или неверно интерпретируют тренды. Новый подход позволяет избежать этих ошибок.
Эксперименты показали, что компактные модели MIT превосходят по точности такие коммерческие решения, как GPT-4 и другие крупные языковые модели. При этом они требуют гораздо меньше вычислительных ресурсов, что делает их доступными для интеграции в мобильные устройства и веб-приложения.
Технология основана на специальной архитектуре, которая обучается на синтезированных графических данных. Такой подход позволяет модели обобщать знания без переобучения на конкретном стиле графиков. Исследователи подчеркивают, что модель способна анализировать не только простые линейные графики, но и сложные столбчатые диаграммы и круговые диаграммы.
Практическое применение разработки может быть широким: от автоматического описания статистических отчетов до помощи слабовидящим пользователям в интерпретации визуальной информации. В будущем такие модели могут стать основой для интеллектуальных помощников в научных и бизнес-приложениях.
Разработка MIT еще раз подтверждает, что для эффективного ИИ не всегда нужны огромные вычислительные мощности — иногда ключевую роль играет правильно спроектированная архитектура и качество обучающих данных.







