Обозреватель «Ъ FM» Александр Леви рассматривает актуальную проблему, связанную с позицией крупных корпораций относительно использования их контента для обучения систем искусственного интеллекта. Примером такой ситуации может служить решение компании Meta, которая была признана экстремистской и запрещена на территории России.
Meta запретила поисковым ботам Apple, включая Applebot и расширенную версию Applebot-Extended, собирать данные из своих платформ — Instagram и Facebook, чтобы предотвратить их использование для улучшения алгоритмов искусственного интеллекта.
Основная цель веб-краулеров, таких как Applebot, заключается в оптимизации работы голосового помощника Siri и инструментов поиска на устройствах Apple, например Spotlight. Конкретно, Applebot-Extended задействован для обучения систем искусственного интеллекта внутри компании Apple.
Данный шаг со стороны Meta еще более подчеркивает важность защиты прав на контент и звучит как предупреждение об этических аспектах сбора данных в сети с целью обучения ИИ. В современных условиях, когда активные законодательные инициативы по регулированию этой сферы отсутствуют, ситуация развивается в стихийном режиме.
К примеру, многие известные новостные ресурсы и медиа-платформы также присоединились к протесту против работы веб-краулеров Apple. К таким изданиям относятся такие гиганты, как The New York Times, Vox Media, Tumblr, The Atlantic и Conde Nast, что указывает на широту проблемы и её затрагиваемость различных участников медиаиндустрии.
Весь процесс блокировки действий ботов довольно прост. Для того чтобы заблокировать работу Applebot-Extended, который был запущен всего три месяца назад, достаточно внести в файл robots.txt команду «Disallow» и сохранить изменения. Несмотря на то что многие ресурсы создали такие барьеры для работы Applebot, ситуация не выглядит критичной.
Согласно информации от Wired, приблизительно 6% высокооплачиваемых сайтов заблокировали доступ для Applebot-Extended. Четыре из десяти новостных изданий также ограничили работу этого бота, что говорит о настороженности медиа-компаний к использованию их контента для создания новых продуктов на базе искусственного интеллекта.
Сравнивая с активностью других технологических компаний, следует отметить, что аналогичный веб-краулер от OpenAI был заблокирован на 53% случаев, а 43% новостных изданий отказались от сотрудничества с инструментами, предлагаемыми Google для обучения своих ИИ-систем.
Все это подчеркивает растущее недовольство среди владельцев контента по поводу несанкционированного использования их материалов для обучения технологий, которые могут впоследствии заменить человеческий труд или посягнуть на их интеллектуальную собственность.
Компания Meta, как видно, является далеко не единственным игроком на этом поле. Другие компании также осознают риски, связанные с предоставлением доступа к своим данным для обучения ИИ, и принимают схожие меры для защиты своих интересов.
В результате, существует растущее количество новостей о таких запретах и дальнейших инициативах, что указывает на необходимость разработки ясных и четких норм, регулирующих данную сферу, а также защиту прав владельцев контента в условиях стремительного развития технологий искусственного интеллекта.