«Первый ИИ-программист» не оправдал ожиданий

Проект Devin, который заявлен как «первый ИИ-программист», не оправдал высоких ожиданий. Запущенный в 2024 году, сервис был призван упростить работу разработчиков, помогая с написанием, тестированием и даже исправлением кода. Однако после проведения тестов выяснилось, что ИИ-программист способен успешно выполнять лишь 15% из всех поставленных перед ним задач. Это крайне низкий показатель для системы, которую позиционировали как революционную в мире программирования.

Разработчики из компании Cognition AI, стоящей за проектом, утверждали, что Devin использует несколько мощных нейросетей, включая GPT-4, что должно было обеспечить высокую эффективность и решение широкого круга задач. Однако на практике система оказалась не способной правильно справляться с базовыми задачами, такими как перенос данных или создание простых программ. Например, в одном из тестов Devin не смог развернуть приложения на платформе Railway, несмотря на то, что задача казалась вполне выполнимой.

Тестирование, проведенное командой специалистов в январе 2025 года, показало, что из 20 заданий ИИ завершил лишь три с удовлетворительным результатом. В большинстве случаев система застревала в технических тупиках, либо предлагала неработающие решения, что ставит под сомнение её способность полностью заменить живых программистов. Даже задачи, которые должны были быть решены за несколько часов, порой занимали дни, и в итоге приводили к неудачным результатам.

Таким образом, амбиции проекта Devin столкнулись с реальностью, где искусственный интеллект не смог стать полноценным помощником разработчиков. Хотя система и демонстрирует впечатляющий интерфейс и некоторые полезные функции, её низкая результативность в реальных задачах говорит о том, что до настоящего ИИ-программиста ещё далеко. Пока что роль профессионалов в сфере разработки программного обеспечения остаётся незаменимой.