Исследование эффективности нейросетей в программировании

Июл 16, 2025 / 13:34

Многие опытные программисты верили в то, что использование нейросетей для написания кода существенно экономит время. Однако, недавние исследования показали, что это не так. В реальных условиях применение искусственного интеллекта часто приводит к увеличению временных затрат на реализацию проектов. Ожидания, выдвинутые специалистами по машинному обучению и экономистами, не соответствуют реальным результатам, показанным в ходе исследования. К примеру, разработчики из числа участников эксперимента первоначально прогнозировали сокращение времени выполнения задач, но на практике результаты оказались хуже.

В современную эпоху нейросети стали неотъемлемой частью разработки программного обеспечения, хотя их способности далеко не соответствуют концепции «интеллекта». Этот термин часто вводит в заблуждение, и многие эксперты описывают нейросети как «китайские комнаты», подчеркивая, что их реальные функции могут быть значительно ограничены. Несмотря на высокий уровень энтузиазма по поводу возможного применения ИИ, многие тесты, известные как бенчмарки, не всегда способны адекватно отразить реальное применение нейросетей в программировании.

Исследование эффективности нейросетей в программировании

Исследователи из Model Evaluation & Threat Research решили разобраться в этой проблеме, проведя опыт с участием 16 разработчиков, работающих с опенсорсными проектами. Эти проекты требуют постоянной поддержки и внедрения новых функций, что делает их подходящими для анализа реальных преимуществ и недостатков использования нейросетей в программировании.

Исследование, проводившееся с участием 246 задач, предполагало сравнение эффективности решения сложностей с программированием с использованием специализированных нейросетей-кодеров, таких как «Cursor Pro» и «Claude 3.5/3.7 Sonnet» от Anthropic.

Несмотря на свою ограниченную популярность в общем IT-сообществе, эти нейросети высоко ценятся среди программистов, так как были созданы с фокусом на автоматизацию процессов написания кода. Половина задач выполнялась с помощью этих систем, а другая без их помощи.

Перед началом работы команды оценили время, необходимое для выполнения задач, включая обработку изменений в коде, что добавило сложности в конечный подсчет. Программистов спросили, на сколько, по их мнению, использование ИИ сократит время выполнения задач. Они оценили это средним показателем в 24%.

Однако, после выполнения задач мнения изменились: разработчики считали, что решение с нейросетями сократило время лишь на 20%. В то же время, научные исследователи, отслеживавшие реальные затраты времени через записи экрана, обнаружили, что задач, выполненных с помощью ИИ, занимали на 19% больше времени, чем те, что решались вручную. Это неожиданное открытие стало темой дальнейшего анализа.

Одной из причин, которую они указывали, стало то, что программисты имели пятилетний опыт работы с указанными репозиториями, что дало им глубокое понимание их структуры и типичных проблем.

Работа с открытым программным обеспечением требует высокой ответственности от программистов, так как каждая ошибка может иметь серьезные последствия.

В отличие от разработки коммерческого ПО, здесь нет места для облегчения в виде вины третьих лиц – программисты должны предупреждать и исправлять недоработки сами.

Исследование затрат времени на задачи показало, что использование ИИ в разработке приносит как положительные, так и отрицательные эффекты. В частности, программы, написанные с помощью нейросетей, требовали значительного времени на ревизию.

Разработчики сначала тратили часы на анализ кода, который создал ИИ, предлагая внесение правок и ожидая их выполнения. Это увеличивало временные затраты, в то время как время, активно потраченное на прямое написание кода и его отладку, сократилось.

Кроме того, лишь 44% сгенерированного ИИ кода было возможно использовать без дополнений, а 9% времени разработчиков ушло на корректировку кода для его нормальной работы.

Исследование также показало, что традиционные бенчмарки производительности, оценивающие её по числу строк кода или по завершённым задачам за конкретный период, не отражают реального положения дел в разработке с использованием ИИ.

Работа над реальными проектами требует времени не только на эксперименты, но и на проверку кода в различных ситуациях. Кроме того, важно интегрировать отдельные элементы разработки в цельное решение. Исследования показывают, что нейросети могут развиться до такой степени, что перестанут замедлять процессы программирования. Однако это остается под вопросом, и только время сможет дать ответ.

Участники эксперимента порой не осознают, что использование ИИ могло замедлить их работу, что подчеркивает сложность объективной оценки ситуации. Возрастающий интерес к нейросетям порой приводит к чрезмерной оптимистичности в их оценке.

В условиях, где связь отсутствует, как в шахтах или отдаленных лесах, важна надежная передача данных. Ученые из Пермского Политеха разработали цифровую радиостанцию, способную противостоять помехам и физическим преградам, например, бетонным стенам.

Устройство обеспечивает передачу данных сразу в двух сетях MANET, демонстрируя скорость до 300 кбит/с в низкоскоростном канале и 54 Мбит/с в высокоскоростном. Рация выполняет функции как ретранслятора, так и узла сети, что делает ее крайне полезной для спасателей, промышленных предприятий и туристов.

Среди ключевых преимуществ устройства – высокая помехоустойчивость, дальность связи до 30 километров и возможность работы при температурах от -25°C до +55°C.

Астрономы установили, что источник определенного шума находится в околоземном пространстве, где более полувека активно функционирует «мертвый» аппарат NASA.

Тем временем российские ученые из Института прикладной математики имени М. В. Келдыша и МФТИ провели уникальное исследование источников шума, возникающего при посадке прототипа сверхзвукового бизнес-джета.

Используя передовые методы вычислительной гидродинамики и аэроакустики, они смогли точно локализовать основные зоны формирования шума вблизи крыла модели самолета в посадочной конфигурации.

Эти результаты могут оказать влияние на получение разрешений на использование отработанной конопли в животноводстве.

Кроме того, новейшая ракета «Starship» демонстрирует интерес со стороны американских ВВС, подчеркивая её потенциал в военной сфере.

Интересно, каким образом военные намерены использовать эту мощнейшую ракету в истории.

По материалам: naked-science.ru