
Компанія DeepSeek, заснована в 2023 році Лян Венфенгом, зі штаб-квартирою в Ханчжоу, Китай, швидко стала значущим гравцем у світовій сфері ШІ. Вийшовши з хедж-фонду High-Flyer, компанія зосереджується на розробці великих мовних моделей (LLM) з відкритим кодом, що кидає виклик таким гігантам галузі, як OpenAI і Google.
У січні 2025 року DeepSeek випустив DeepSeek-R1, модель штучного інтелекту, яка вразила експертів своєю ефективністю в задачах з математики, кодування та міркування. Модель використовує «чисте навчання з підкріпленням», метод, схожий на AlphaZero від Google DeepMind, що дозволяє досягати розширених можливостей, не покладаючись на контрольовані дані. Примітно, що DeepSeek-R1 має відкритий вихідний код за ліцензією Массачусетського технологічного інституту, надає високорівневі можливості штучного інтелекту безкоштовно та руйнує традиційно закритий ринок штучного інтелекту.
Вплив інновацій DeepSeek відчувається в усіх галузях. Акції технічних компаній, зокрема NVIDIA та Microsoft, зазнали помітного падіння, оскільки аналітики передбачають, що DeepSeek може різко знизити витрати на розробку ШІ. Незважаючи на свої технічні досягнення, компанію критикують за інтеграцію механізмів цензури у свої моделі. ШІ уникає чутливих для китайського уряду тем, таких як протести на площі Тяньаньмень і політичний статус Тайваню.
DeepSeek є прикладом стрімкого прогресу Китаю в галузі штучного інтелекту, пропонуючи зазирнути в потенціал моделей ШІ з відкритим кодом для демократизації доступу до передових технологій. Оскільки компанія продовжує розвиватися, вона, ймовірно, сформує майбутній напрямок глобальної індустрії ШІ.
Перейти на сайт