Команда Baidu Qianfan объявила о релизе Qianfan‑OCR, энд‑ту‑энд модели с 4 млрд параметров, которая объединяет парсинг документов, анализ макета и понимание содержимого в единой vision‑language архитектуре. По данным публикации, подход отличается от классических систем, где отдельные модули последовательно выполняют детекцию макета и распознавание текста.

Сообщение о релизе появилось 18 марта 2026 года в публикации MarkTechPost; в ней подчёркивается, что Qianfan‑OCR намерена заменить или упростить традиционные многоступенчатые OCR‑пайплайны за счёт единой модели для всех этапов обработки документов. Дополнительные технические детали и результаты тестов в статье не приводятся.