Поиск по сайту

DeepSeek — это не клон ChatGPT, этим он отличается


Сводка

  • DeepSeek предлагает больше, чем просто финансовую экономию, под капотом скрываются серьезные технологии.
  • DeepSeek выделяется благодаря прозрачным мыслительным процессам, что упрощает настройку вывода.
  • Кэширование контента — еще одно важное техническое новшество, ведущее к гораздо более эффективному подсказыванию.

Последние несколько недель новости о технологиях в основном были о том, как DeepSeek, китайский ответ западным большим языковым моделям (LLM), захватывает мир и, кроме того, отнимает большую часть рыночной стоимости. Что отличает DeepSeek от GPT, и есть ли в нем что-то большее, чем просто дешевле в использовании?

Оказывается, есть. На самом деле, как только вы присмотритесь, вы поймете, что DeepSeek не является каким-то таким же, но более дешевым клоном, которым Китай славится в других отраслях. Это реальный соперник, который внедрил инновации и внес реальные улучшения в модель искусственного интеллекта.

Цепочка мыслей

Как и людям, LLM приходится решать сложную проблему. Я не могу попросить вас просто посчитать сложное уравнение, вам нужно идти шаг за шагом, пока вы не придете к своим выводам. В ИИ это называется «цепочкой мыслей», и это жизненно важный компонент для получения хорошего результата от чат-бота.

Цепочка мыслей может быть тем, где DeepSeek добился наибольших успехов по сравнению с GPT, способным не только прорабатывать сложные загадки (как в этом примере), но и демонстрировать свою работу удовлетворительным образом. Вместо того, чтобы задавать вопрос и просто получать ответ, это позволяет вам проверить работу DeepSeek.

Это также означает, что вы можете попросить об изменениях, если вам не понравится полученный ответ, или попросить DeepSeek ответить на любые вопросы, которые могли прийти вам в голову во время чтения цепочки мыслей. Это мощное дополнение и отличный инструмент для любого пользователя.

Кэширование

Еще один способ, с помощью которого DeepSeek является реальным конкурентом GPT, заключается в кэшировании или временном хранении ваших вопросов и ответов, что позволяет вам построить цепочку вопросов. OpenAI, компания, стоящая за ChatGPT, ограничила кэширование по той простой причине, что оно стоит денег, поэтому вы можете задавать только определенное количество вопросов (лимит устанавливается вашим планом), прежде чем чат-бот «стерет» свою память.

DeepSeek решает эту проблему, используя то, что он называет кэшированием контента на диске. Эта технология обнаруживает дубликаты входных данных, благодаря чему DeepSeek может извлекать более ранние ответы, а не создавать новые. Это экономит много расточительных вычислений и, как следствие, снижает затраты DeepSeek, а также позволяет пользователям создавать более длинные цепочки.

В беседе со специалистом по моделированию искусственного интеллекта Эмилем Жерве DeepSeek также очень прозрачен в отношении того, что он кэширует, а что нет; Вы можете просто посмотреть это. Таким образом, вы можете увидеть, что лучше всего работает при вводе подсказок, что подводит нас к моему последнему пункту.

Оптимизация подсказок

Результатом улучшения кэширования и цепочки мыслей является то, что становится проще создавать более качественные подсказки. Джервейс говорит, что прозрачность DeepSeek в отношении того, как он работает, облегчает понимание того, как создавать команды, которые вы даете ИИ.

Например, при написании приглашения вы можете поместить данные, которые не изменятся по мере создания цепочки, в передний план, убедившись, что DeepSeek использует и повторно использует эту информацию в кэше. Более изменяемые данные должны быть размещены в середине или в конце запросов, что должно обеспечить более четкие ответы.

Хотя это не то, что вы поймете в одночасье, и, возможно, это не слишком полезная информация для обычного человека, она показывает, что DeepSeek — это другое животное, чем GPT, и это нечто большее, чем просто более дешевая «подделка». То, что было начато OpenAI, может закончиться китайской компанией, о которой никто не слышал несколько месяцев назад.