Apple представила искусственный интеллект, который может превзойти ChatGPT
RSSКоманда специалистов-исследователей Apple разработала новую ИИ-систему, которая получила название Reference Resolution As Language Modeling (ReALM). Потенциально она способна заметно улучить возможности голосовых ассистентов. ReALM может понимать неоднозначные ссылки на объекты на экране, а также учитывать разговорный и контекстный фон.
ReALM от Apple включает в себя способность ИИ точно понимать и ссылаться на контекстно-зависимые объекты в разговоре или визуальном поле. В отличие от традиционных моделей, которые могут давать сбои при интерпретации расплывчатых упоминаний типа «то» или «оно», ReALM демонстрирует превосходное понимание, тем самым обещая более интуитивное взаимодействие пользователя с технологией.
Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора.
ИИ-система Apple преобразовывает информацию на экране в текст, что позволяет системе работать локально на устройстве без необходимости ресурсоёмкого распознавания изображений. ИИ может понимать, что происходит на экране, в том числе и задачи, происходящие в фоновом режиме.
В тестах, сравнивающих ReALM с ChatGPT 3.5 и 4.0, самая маленькая модель ReALM показала результаты, сопоставимые с GPT-4, а более крупные модели значительно превзошли последний.
Предполагается, что именно эта технология станет основной в развитии операционной системы iOS 18-й версии и главной темой на будущей конференции WWDC 2024, которая стартует 10 июня 2024 года.
