OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o

Логотип компании
12.09.2024Автор
OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o

Фото: PatrickAssale / Shutterstock

OpenAI представила новую модель искусственного интеллекта o1, которая способна рассуждать и решать задачи, как человек. Новая модель в 6 раз лучше пишет код, в 5 раз быстрее решает математические задачи и готова бросить вызов ученым и программистам.

12 сентября 2024 года OpenAI представила новую модель OpenAI o1, которая способна буквально «думать» как человек. Эта модель не просто генерирует текст на основе данных, а строит логические рассуждения, анализирует задачи и улучшает ответы, что делает ее в 5–6 раз производительнее предыдущей модели GPT-4o. IT-World уже сообщал о работе OpenAI над новой технологией под кодовым названием «Strawberry», которая позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования».

Основные показатели новой модели говорят сами за себя. На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как OpenAI o1 справилась с 83%, что соответствует уровню 500 лучших студентов США. В программировании результаты не менее впечатляющие: на платформе Codeforces o1 заняла 89-й процентиль, продемонстрировав способность решать сложные задачи на уровне ведущих участников соревнований.

OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o. Рис. 1

OpenAI утверждает, что о1 обучена «думать», подобно человеку, используя методику обучения с подкреплением. Это значит, что модель анализирует возможные варианты, строит цепочку мыслей (chain of thought), проверяет свои шаги и только затем выдает ответ. Такой подход позволяет существенно повысить точность и эффективность модели, что особенно важно в научных приложениях, математике и программировании.

Для сравнения: GPT-4o, предыдущая версия модели, решала только 12% задач на экзамене AIME (Американская математическая олимпиада), тогда как OpenAI o1 достигла 74% правильных решений. При повторном ранжировании 1000 образцов с использованием функции подсчета баллов модель o1 показала результат в 93%. В тестах по физике, биологии и химии (GPQA diamond) OpenAI o1 также превзошла экспертов с докторскими степенями, став первой моделью, достигшей такого уровня.

Исследователи пытаются понять, как работают большие языковые модели

Одновременно OpenAI усиливает меры безопасности, совершенствуя внутренние протоколы и взаимодействие с федеральными правительствами, чтобы соответствовать этическим нормам и минимизировать риски. По данным компании, новый подход к обучению и интеграции цепочки рассуждений в поведение модели способствует лучшему обучению модели человеческим ценностям и принципам.

У ChatGPT уже есть приложения для Android и iOS, и десктопная версия для MacOS. Тем не менее для пользователей из России доступ к ChatGPT ограничен. IT-World ранее разбирался какие нейросети доступны в России, как к ним подключиться и использовать.

Пока OpenAI o1 остается дорогим решением: стоимость использования через API составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в 3-4 раза дороже по сравнению с GPT-4o. Но компания уверена, что эта инвестиция окупится за счет повышения качества решений и скорости работы в критически важных задачах.

На данный момент OpenAI предоставляет доступ к o1 в виде превью-версии для пользователей ChatGPT Plus и Team, а также API-доступ. Разработчики также анонсировали более доступную версию o1-mini, которая будет дешевле на 80% и также подойдет для программирования и других задач, требующих высокого уровня анализа. Полноценная версия модели обещана к релизу в ближайшее время.

Читайте также
Как руководителю развить эмпатию и построить доверительную коммуникацию в коллективе, разбирался IT-World.

Похожие статьи