IBM Granite 3.2 использует условные рассуждения, прогнозирование временных рядов и видение документов для решения сложных корпоративных задач

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше
После прорывного дебюта DeepSeek-R1 в 2025 году модели рассуждений стали настоящим хитом.
IBM теперь присоединяется к вечеринке, представив сегодня свое семейство больших языковых моделей (LLM) Granite 3.2. В отличие от других подходов к рассуждениям, таких как DeepSeek-R1 или o3 от OpenAI, IBM глубоко встраивает рассуждения в свои основные модели Granite с открытым исходным кодом. Это подход, который IBM называет условными рассуждениями, где пошаговая цепочка рассуждений (CoT) является опцией внутри моделей (в отличие от отдельной модели).
Это гибкий подход, при котором рассуждения могут быть условно активированы с помощью флага, что позволяет пользователям контролировать, когда использовать более интенсивную обработку. Новая возможность рассуждений основана на повышении производительности, которое IBM представила с выпуском Granite 3.1 LLM в декабре 2024 года.
IBM также выпускает новую модель визуализации в семействе Granite 3.2, специально оптимизированную для обработки документов. Модель особенно полезна для оцифровки устаревших документов, с которой сталкиваются многие крупные организации.
Еще одна задача корпоративного ИИ, которую IBM стремится решить с помощью Granite 3.2, — это предиктивное моделирование. Машинное обучение (МО) использовалось для прогнозирования десятилетиями, но у него не было естественного языкового интерфейса и простоты использования современного поколения ИИ. Вот где подходят модели прогнозирования временных рядов IBM Granite; они применяют технологию трансформатора для прогнозирования будущих значений на основе временных данных.
«Рассуждение — это не то, чем является модель, это то, что модель делает», — сказал в интервью VentureBeat Дэвид Кокс, вице-президент по моделям ИИ в IBM Research.
Хотя в 2025 году не было недостатка в ажиотаже и шумихе вокруг моделей рассуждений, рассуждения сами по себе не обязательно представляют ценность для корпоративных пользователей.
Способность рассуждать во многих отношениях давно является частью поколения ИИ. Простое побуждение LLM к ответу в пошаговом подходе запускает базовый вывод рассуждений CoT. Современные рассуждения в таких моделях, как DeepSeek-R1, а теперь и Granite 3.2, идут немного глубже, используя обучение с подкреплением для тренировки и включения возможностей рассуждений.
Хотя подсказки CoT могут быть эффективны для определенных задач, таких как математика, возможности рассуждения в Granite 3.2 могут принести пользу более широкому спектру корпоративных приложений. Кокс отметил, что, поощряя модель тратить больше времени на размышления, предприятия могут улучшить сложные процессы принятия решений. Рассуждение может принести пользу задачам разработки программного обеспечения, решению ИТ-проблем и другим агентским рабочим процессам, где модель может разбивать проблемы, принимать более обоснованные решения и рекомендовать более обоснованные решения.
IBM также утверждает, что при включении логического мышления Granite 3.2 способен превзойти конкурентов, включая DeepSeek-R1, в задачах следования инструкциям.
Хотя Granite 3.2 имеет расширенные возможности рассуждения, Кокс подчеркнул, что не каждый запрос на самом деле нуждается в большем количестве рассуждений. Фактически, многие типы общих запросов могут быть фактически негативно затронуты большим количеством рассуждений.
Например, для запроса, основанного на знаниях, автономная модель рассуждений, такая как DeepSeek-R1, может потратить до 50 секунд на внутренний монолог, чтобы ответить на простой вопрос, например «Где находится Рим?»
Одним из ключевых нововведений в Granite 3.2 является введение функции условного мышления, которая позволяет разработчикам динамически активировать или деактивировать возможности рассуждения модели. Эта гибкость позволяет пользователям находить баланс между скоростью и глубиной анализа в зависимости от конкретной задачи.
Идя на шаг дальше, модели Granite 3.2 используют метод, разработанный подразделением IBM Red Hat, который использует так называемый «фильтр частиц» для обеспечения более гибких возможностей рассуждений.
Этот подход позволяет модели динамически контролировать и управлять несколькими потоками рассуждений, оценивая, какие из них наиболее перспективны для достижения конечного результата. Это обеспечивает более динамичный и адаптивный процесс рассуждений, а не линейный CoT. Кокс объяснил, что этот метод фильтрации частиц дает предприятиям еще большую гибкость в том, как они могут использовать возможности рассуждений модели.
В подходе фильтра частиц одновременно происходит множество потоков рассуждений. Фильтр частиц отсекает менее эффективные подходы, сосредотачиваясь на тех, которые обеспечивают лучшие результаты. Таким образом, вместо того, чтобы просто делать рассуждения CoT, есть несколько подходов к решению проблемы. Модель может разумно ориентироваться в сложных проблемах, выборочно сосредотачиваясь на наиболее перспективных линиях рассуждений.
Крупные организации, как правило, имеют одинаково большие объемы документов, многие из которых были отсканированы много лет назад и теперь лежат в архивах. Все эти данные было трудно использовать в современных системах.
Новая модель визуализации Granite 3.2 разработана для решения этой корпоративной проблемы. В то время как многие мультимодальные модели фокусируются на общем понимании изображений, возможности визуализации Granite 3.2 разработаны специально для обработки документов — отражая фокус IBM на решении реальных корпоративных проблем, а не на погоне за результатами тестов.
Система нацелена на то, что Кокс описал как «нерациональные объемы старых отсканированных документов», находящихся в корпоративных архивах, особенно в финансовых учреждениях. Они представляют собой непрозрачные хранилища данных, которые остаются в значительной степени неиспользованными, несмотря на их потенциальную ценность для бизнеса.
Для организаций, десятилетиями хранящих бумажные документы, возможность интеллектуальной обработки документов, содержащих диаграммы, рисунки и таблицы, представляет собой существенное операционное преимущество по сравнению с универсальными мультимодальными моделями, которые отлично подходят для описания фотографий из отпуска, но плохо справляются со структурированными деловыми документами.
В корпоративных тестах производительности, таких как DocVQA и ChartQA, IBM Granite Vision 3.2 демонстрирует высокие результаты по сравнению с конкурентами.
Пожалуй, наиболее технически отличительным компонентом релиза являются «миниатюрные временные микшеры» (TTM) от IBM — специализированные модели на основе трансформаторов, разработанные специально для прогнозирования временных рядов.
Однако прогнозирование временных рядов, которое позволяет проводить предиктивную аналитику и моделирование, не является чем-то новым. Кокс отметил, что по разным причинам модели временных рядов застряли в старой эпохе машинного обучения (ML) и не получили того же внимания со стороны более новых, более ярких моделей ИИ-поколения.
Модели Granite TTM применяют архитектурные инновации, которые привели к развитию LLM, к совершенно иной проблемной области: прогнозирование будущих значений на основе исторических моделей. Эта возможность удовлетворяет критически важные потребности бизнеса в области финансового прогнозирования, планирования технического обслуживания оборудования и обнаружения аномалий.
Недостатка в шумихе нет, и поставщики утверждают, что превзошли друг друга по бесчисленному количеству отраслевых показателей.
Для лиц, принимающих решения на предприятии, принятие во внимание бенчмарков может быть интересным, но это не то, что решает болевые точки. Кокс подчеркнул, что IBM придерживается подхода «костюм и галстук» к корпоративному ИИ, стремясь решить реальные проблемы.
«Я думаю, что сейчас много магических мыслей о том, что у нас может быть одна суперинтеллектуальная модель, которая каким-то образом будет делать все, что нам нужно, и, по крайней мере, на данный момент мы даже близко к этому не подошли», — сказал Кокс. «Наша стратегия такова: «Давайте создадим реальные, практические инструменты, используя эту очень интересную технологию, и давайте встроим в нее как можно больше функций, которые облегчат выполнение реальной работы».
Если вы хотите произвести впечатление на своего босса, VB Daily вам поможет. Мы даем вам внутреннюю информацию о том, что компании делают с генеративным ИИ, от изменений в регулировании до практических развертываний, чтобы вы могли поделиться идеями для максимальной окупаемости инвестиций.
Ознакомьтесь с нашей Политикой конфиденциальности
Спасибо за подписку. Ознакомьтесь с другими рассылками VB здесь .
Произошла ошибка.

venturebeat