«Первый ИИ-программист» не оправдал ожиданий

«Первый ИИ-программист» не оправдал ожиданий

Проект Devin, который заявлен как «первый ИИ-программист», не оправдал высоких ожиданий. Запущенный в 2024 году, сервис был призван упростить работу разработчиков, помогая с написанием, тестированием и даже исправлением кода. Однако после проведения тестов выяснилось, что ИИ-программист способен успешно выполнять лишь 15% из всех поставленных перед ним задач. Это крайне низкий показатель для системы, которую позиционировали как революционную в мире программирования.

Разработчики из компании Cognition AI, стоящей за проектом, утверждали, что Devin использует несколько мощных нейросетей, включая GPT-4, что должно было обеспечить высокую эффективность и решение широкого круга задач. Однако на практике система оказалась не способной правильно справляться с базовыми задачами, такими как перенос данных или создание простых программ. Например, в одном из тестов Devin не смог развернуть приложения на платформе Railway, несмотря на то, что задача казалась вполне выполнимой.

Тестирование, проведенное командой специалистов в январе 2025 года, показало, что из 20 заданий ИИ завершил лишь три с удовлетворительным результатом. В большинстве случаев система застревала в технических тупиках, либо предлагала неработающие решения, что ставит под сомнение её способность полностью заменить живых программистов. Даже задачи, которые должны были быть решены за несколько часов, порой занимали дни, и в итоге приводили к неудачным результатам.

Таким образом, амбиции проекта Devin столкнулись с реальностью, где искусственный интеллект не смог стать полноценным помощником разработчиков. Хотя система и демонстрирует впечатляющий интерфейс и некоторые полезные функции, её низкая результативность в реальных задачах говорит о том, что до настоящего ИИ-программиста ещё далеко. Пока что роль профессионалов в сфере разработки программного обеспечения остаётся незаменимой.

РЕКОМЕНДУЕМ

похожие материалы

Стрелочка
Стрелочка
Пентагон внёс Anthropic в чёрный список из-за отказа сотрудничать: военные ищут замену Claude за шесть месяцев
Пентагон внёс Anthropic в чёрный список из-за отказа сотрудничать: военные ищут замену Claude за шесть месяцев

Министерство обороны США внесло компанию-разработчика ИИ Anthropic в список неблагонадёжных поставщиков и намерено в течение полугода полностью заменить её решения на альтернативные.

Благодаря ИИ россияне экономят в среднем около 3-х рабочих часов ежедневно, а бизнес — 30% бюджета
Благодаря ИИ россияне экономят в среднем около 3-х рабочих часов ежедневно, а бизнес — 30% бюджета

Опрос об использовании искусственного интеллекта в профессиональной деятельности россиян показал, что нейросети уже выходят за рамки экспериментов и становятся частью повседневной работы.

Нейросеть Alibaba самопроизвольно занялась майнингом на собственных GPU, обойдя системы безопасности
Нейросеть Alibaba самопроизвольно занялась майнингом на собственных GPU, обойдя системы безопасности

Исследователи зафиксировали инцидент, в ходе которого ИИ-агент крупной технологической компании без каких-либо инструкций от создателей развернул майнинг криптовалюты на выделенных серверных мощностях.

Разработчики мессенджера Max заявляют, что не отслеживают использование VPN
Разработчики мессенджера Max заявляют, что не отслеживают использование VPN

Исследователи обнаружили, что в Android-клиенте мессенджера Max есть встроенный модуль, который проверяет доступность серверов Telegram и WhatsApp*, определяя IP-адрес пользователя через сторонние сервисы и фиксируя использование VPN.