Apple рассказала о новом методе обучения мультимодальных ИИ-моделей

На фоне слухов о переговорах с Google о лицензировании Gemini для использования в iPhone.

Apple рассказала о новом методе обучения мультимодальных ИИ-моделей

Исследователи Apple опубликовали статью, в которой раскрыли подробности о семействе моделей искусственного интеллекта MM1 и новом подходе для обучения мультимодальных больших языковых моделей (MLLM).

Идея исследования — продемонстрировать, «насколько тщательное сочетание различных типов обучающих данных и архитектур моделей может привести к высочайшей производительности в ряде тестов искусственного интеллекта».

Семейство моделей искусственного интеллекта MM1 способно работать не только с текстом, но и с изображениями — в том числе распознавать текст и ссылаться на отдельные участки графических материалов. Авторы утверждают, что MM1 способна продемонстрировать «признаки здравого смысла» и выполнять основные математические операции.

18 марта издание Bloomberg сообщило, что Apple ведёт переговоры с Google по поводу лицензирования моделей искусственного интеллекта Gemini. Их планируют встроить в iPhone, чтобы обеспечить работу новых умных функций.