Article

Команда Baidu Qianfan представила Qianfan‑OCR — 4 млрд параметров для единой обработки документов

Энд‑ту‑энд модель объединяет парсинг, анализ макета и понимание документов в одной vision‑language архитектуре.

18 марта 2026 г. в 18:41Обновлено: 22 марта 2026 г. в 04:17Global AI News DeskMarkTechPost3 мин

Суть

Коротко по делу

01
Baidu Qianfan выпустила Qianfan‑OCR — модель на 4 млрд параметров, спроектированную для единой обработки документов вместо традиционных многоступенчатых OCR‑пайплайнов.
02
Команда Baidu Qianfan объявила о релизе Qianfan‑OCR, энд‑ту‑энд модели с 4 млрд параметров, которая объединяет парсинг документов, анализ макета и понимание содержимого в единой…
03
Сообщение о релизе появилось 18 марта 2026 года в публикации MarkTechPost; в ней подчёркивается, что Qianfan‑OCR намерена заменить или упростить традиционные многоступенчатые…

Что произошло

Baidu Qianfan выпустила Qianfan‑OCR — модель на 4 млрд параметров, спроектированную для единой обработки документов вместо традиционных многоступенчатых OCR‑пайплайнов.

Почему это важно

Единая модель может упростить разработку и развертывание систем документной аналитики и сократить сложность интеграции нескольких модулей, что важно для приложений автоматизации документооборота и извлечения данных.

Разбор

Контекст

Команда Baidu Qianfan объявила о релизе Qianfan‑OCR, энд‑ту‑энд модели с 4 млрд параметров, которая объединяет парсинг документов, анализ макета и понимание содержимого в единой vision‑language архитектуре. По данным публикации, подход отличается от классических систем, где отдельные модули последовательно выполняют детекцию макета и распознавание текста.

Что это меняет

Сообщение о релизе появилось 18 марта 2026 года в публикации MarkTechPost; в ней подчёркивается, что Qianfan‑OCR намерена заменить или упростить традиционные многоступенчатые OCR‑пайплайны за счёт единой модели для всех этапов обработки документов. Дополнительные технические детали и результаты тестов в статье не приводятся.

Источник

MarkTechPost

Команда Baidu Qianfan представила Qianfan‑OCR — 4 млрд параметров для единой обработки документов

marktechpost.com

Публичный источник сигнала; для спорных деталей полезно сверять первоисточник.

Открыть первоисточник

Почему архиву можно доверять

Источник виден, переписывание объяснено, обновления отмечены

Каждый материал привязан к первичному источнику, а не к случайному пересказу.

Мы разделяем, что произошло, почему это важно и что именно стоит проверить дальше.

Как устроена методология

Связанные материалы

17 апр.The DecoderНовость3 мин

Крупный план профильного лица андроида слева, в центре голографическая двойная спираль ДНК с плавающими биоблоками (мышь, растение, клетки) над лабораторным устройством, справа учёный в халате работает у микроскопа в современной лаборатории, холодная синяя подсветка, детализированная редакционная сц

OpenAI выпустила GPT‑Rosalind — модель рассуждения для исследований в бионауках

Модель создана для ускорения перехода от гипотез к экспериментам; доступ к ней сейчас строго контролируется.

Модели OpenAI

Открыть

16 апр.MarkTechPostНовость3 мин

Двое исследователей в лабораторных халатах внимательно изучают металлическую петлю в форме знака бесконечности с подсвеченными электронными дорожками, установленную на плате с компонентами; за ними — серверный зал и атмосферный робот.

UCSD и Together AI Research представили Parcae — стабильную архитектуру для петлевых языковых моделей

Авторы утверждают, что Parcae по качеству соответствует трансформеру в два раза большего размера.

Модели

Открыть

14 апр.MIT Technology Review AIНовость3 мин

Женщина-учёный в белом халате в лаборатории смотрит на три выставленных экспоната на столе: голографический мозг (символ ИИ), растение в стеклянной колбе (биотехнологии) и светящийся энергетический модуль (энергетика). Тёпло-холодное кинематографическое освещение, чистая и сфокусированная композиция

MIT Technology Review анонсировал список «10 Breakthrough Technologies» на 2026 год

Редакция готовит ежегодный список «10 Breakthrough Technologies» и сообщает о сложностях отбора для 2026 года.

Модели

Открыть

Еще по этой теме

13 апр.The DecoderНовость3 мин

Утекший мемурандум: OpenAI разрабатывает модель «Spud», которая «значительно улучшит» продукты компании

В меморандуме перечислены пять стратегических приоритетов корпоративного направления, включая платформенное решение для агентов ИИ.

Модели OpenAI

Открыть

12 апр.TechCrunch AIНовость3 мин

Три силуэта чиновников в костюмах стоят в комнате с серверными стойками и банковским хранилищем, наблюдая за крупной голубой голографической моделью мозга/нейросети, парящей над технологической платформой.

Чиновники администрации Трампа могут побуждать банки тестировать Mythos от Anthropic

TechCrunch сообщил 12 апреля 2026 года, что представители администрации Трампа поощряют банки пробовать модель Mythos компании Anthropic.

Модели

Открыть

11 апр.MarkTechPostНовость3 мин

Три исследователя в белых халатах в серверной комнате смотрят на центральную голографическую воронку, которая сжимает высокую стопку синих кубов слева в компактную стопку зелёных кубов справа; кинематографичное освещение, чистый фокус, журнальная иллюстрация.

TriAttention от MIT, NVIDIA и Zhejiang University: сжатие KV‑кеша с пропускной способностью в 2,5 раза выше

Метод TriAttention сжимает KV‑кеш, достигая точности, сопоставимой с полным вниманием, и повышая пропускную способность в 2,5×.

Чипы Модели

Открыть

10 апр.TechCrunch AIНовость3 мин

Человек у запертого стеклянного отсека с крупным замком и цепями; по ту сторону стекла — спокойный андроид (символ модели Claude); металлическая рука на переднем плане усиливает напряжение; холодный синий фон слева и тёплый оранжевый свет справа.

Anthropic временно заблокировала доступ создателя OpenClaw к Claude

Блокировка произошла после изменения цен для пользователей OpenClaw на прошлой неделе.

Модели

Открыть