Microsoft Kosmos-1
Многомодельная большая языковая модель от Microsoft
О Microsoft Kosmos-1
Компания Microsoft недавно разработала Kosmos-1, мощную многомодельную большую языковую модель. Она способна отвечать на языковые запросы, а также на визуальные указания, и может использоваться для различных задач, таких как описание изображений, ответы на вопросы на основе изображений и многое другое. Kosmos-1 может принимать входные данные в виде изображений и аудио, что позволяет ей превзойти ChatGPT, который работает только с текстовыми запросами.
Модель KOSMOS-1 создана для поддержки языковых, языкопонимающих и визуальных задач. Microsoft обучил модель с использованием больших наборов данных, включающих текстовые данные, пары изображений и текста, а также переплетенные изображения и слова. Модель KOSMOS-1 может обрабатывать задачи, требующие восприятия, а также естественноязыковые задачи, такие как визуальный диалог, визуальное объяснение, ответы на вопросы на основе изображения, описание изображений, простые математические уравнения, распознавание текста на изображении и классификация изображений с использованием описаний.
Источник: https://www.zdnet.com/article/now-microsoft-has-a-new-ai-model-kosmos-1/
Microsoft Kosmos-1 скриншоты
Читать на английском