Китайская компания DeepSeek представила свой чат-бот, использующий языковую модель DeepSeek V3, которая доступна без специальной подписки.
Модель, выпущенная в ноябре 2024 года, содержит 671 миллиард параметров и обучена на 14,8 триллионах токенов.
Разработчики утверждают, что этот чат-бот способен составить конкуренцию таким системам, как ChatGPT, и имеют амбиции по созданию «сверхразумного» ИИ.
DeepSeek V3 может выполнять множество задач, включая анализ текстов, переводы, написание эссе и создание кода.
Модель использует архитектуру Multi-token Prediction, которая позволяет предсказывать несколько слов одновременно, повышая точность и производительность.
Также внедрена архитектура mixture of Experts, задействующая 256 нейросетей-экспертов для более эффективного анализа входных данных, при этом для каждого токена активируются восемь таких сетей.
Система применяет механизм внимания Multi-head Latent Attention, который позволяет более точно выделять важные части текста.
Это означает, что ИИ может многократно извлекать ключевую информацию из фрагментов текста, что снижает вероятность пропуска значимых данных.
Обучение модели заняло всего 2,788 миллионов часов, или два месяца, работы графических процессоров Nvidia H800.
Затраты на разработку новой нейросети DeepSeek составили $5,5 млн. Для сравнения, обучение GPT от OpenAI обошлось в $78 млн.
Разработчики уверяют, что DeepSeek превзошла такие модели, как «GPT-4o» от OpenAI, «Llama 3» от Meta и «Claude 3.5 Sonnet» от Anthropic в задачах программирования и обработки текстов.
Одной из ключевых особенностей DeepSeek является полностью открытый код, что позволяет разработчикам адаптировать технологию для различных задач в области искусственного интеллекта, включая коммерческое использование.
Модель предлагает контекстное окно в 128 тыс. токенов, что сопоставимо с «GPT-4o» и дает возможность анализировать до 300 страниц текста. Она также способна писать и форматировать код, а также решать сложные задачи на языках программирования, включая C++, Go, Java, JavaScript, Python и Rust.
Интеграция с редакторами кода весьма успешная. DeepSeek V3 демонстрирует высокий уровень мультиязычности, с глубоким пониманием английского и китайского языков, обеспечивая точность перевода и сохранение смысла. Поддерживается и русский язык.
Однако нейросеть пока не может анализировать материалы по внешним ссылкам, ограничиваясь загрузками текстов или их выдержками.
DeepSeek предлагает несколько вариантов доступа: открытые модели на Hugging Face, бесплатную версию с ограничением в 32 тыс. токенов на собственном сайте, API для коммерческого использования, а также локальное развертывание и мобильные приложения для iOS и Android.
На момент выхода DeepSeek-R1 пользователю были доступны 50 бесплатных запросов в день, но в настоящее время ограничения не указаны.
В диалоговом окне с чат-ботом можно выбрать возможности DeepThink для рассуждений или Search для поиска данных в Интернете.
Пользователи могут прикрепить до 50 файлов различного формата, максимальный размер которых составляет 100 МБ.
В декабре 2024 года DeepSeek запустила бесплатное мобильное приложение, доступное в российских магазинах App Store и Google Play, а также на сайте разработчиков.
После установки и регистрации пользователям становится доступно диалоговое окно с ботом.
Эксперты подчеркивают, что Алматы занимает ведущее место в развитии казахстанского туризма, особенно в сфере экологического туризма, включая горный кластер.
Однако катастрофическая экологическая ситуация остается одной из главных проблем.
Для улучшения экологии и развития туризма в Алматы необходимо принять меры, направленные на улучшение качества воздуха и сохранение природных ресурсов.