Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Китайский стартап DeepSeek V3, обладающий инновационными технологиями, такими как многократный прогноз (MTP), смесь экспертов (MOE) с использованием 256 нейронных сетей и многопользовательского скрытого внимания (MLA), первоначально заявили о стоимости обучения всего 6 миллионов долларов, используя 2048 Графические процессоры. Эта, казалось бы, низкая цифра, однако, резко контрастирует с результатами полуанализа, выявляющими масштабную инфраструктуру из примерно 50 000 графических процессоров NVIDIA (включая H800, H100 и H20 единицы) в течение нескольких данных обработки данных, представляющие общие инвестиции в сервер примерно 1,6 миллиарда долларов и операционные расходы вблизи 944 миллиона долларов.
Изображение: Ensigame.com
Изображение: Ensigame.com
Deepseek, дочерняя компания Hedge Fund Hedge Fund, владеет своими центрами обработки данных, способствуя быстрому инновациям и оптимизации. Его самофинансируемая природа и высокая заработная плата (некоторые исследователи зарабатывают более 1,3 миллиона долларов в год) привлекают лучших китайских талантов, способствуя его успеху. Первоначальная цифра в 6 миллионов долларов отражает только предварительные затраты на графический процессор, пропуская исследования, уточнение, обработку данных и расходы на инфраструктуру. Фактические инвестиции DeepSeek в развитие ИИ превышают 500 миллионов долларов. Несмотря на эти значительные инвестиции, его бережливая структура обеспечивает эффективные инновации по сравнению с более крупными, более бюрократическими конкурентами.
Изображение: Ensigame.com
Изображение: Ensigame.com
Хотя утверждение «Революционного бюджета» Deepseek, возможно, завышен, его успех подчеркивает конкурентный потенциал хорошо финансируемой независимой компании по искусственному искусству. Контраст является резким при сравнении затрат на обучение: r1 Deepseek стоил 5 миллионов долларов, в то время как CHATGPT-4, как сообщается, стоит 100 миллионов долларов, подчеркивая относительную экономическую эффективность DeepSeek, даже с его значительными общими инвестициями.