Microsoft’s FP4 Training vs. DeepSeek: A New AI Cost War Unfolds (Vietnamese below)
The battle over AI training costs is heating up, and Microsoft has just made its move. With the unveiling of its FP4 training framework, the tech giant is making a bold statement: training large language models (LLMs) no longer needs to drain corporate treasuries. But how does this compare to DeepSeek, the upstart from China that has rattled the industry with claims of cutting-edge efficiency at a fraction of the cost?

For years, training advanced AI models has been an expensive endeavor, requiring vast computing resources and substantial financial investment. Microsoft and Meta have long championed this approach, betting billions on expanding AI capabilities. But DeepSeek, with its reportedly frugal $6 million AI development budget, is challenging the very notion that scale must come with sky-high costs.
The Economics of AI: Big Bets vs. Lean Innovation
Microsoft and Meta remain steadfast in their belief that heavy spending on AI infrastructure is not just a necessity but a competitive advantage. Microsoft CEO Satya Nadella has emphasized that continued investment is key to overcoming capacity constraints and capitalizing on AI demand. Meta’s Mark Zuckerberg echoes this sentiment, viewing capital expenditure as a long-term strategic imperative.
Their commitment to large-scale spending is evident in the numbers: Microsoft has earmarked $80 billion for AI in its current fiscal year, while Meta is set to invest up to $65 billion. Meanwhile, DeepSeek, using an alternative approach, claims to have built models that match or surpass Western rivals at a fraction of the cost.
The stark contrast between these financial strategies is raising questions among investors. Microsoft shares dropped 6% after the company signaled slower-than-expected growth in its Azure cloud division, a key component of its AI infrastructure. Meta’s mixed performance has also left analysts debating whether these colossal AI investments will yield the expected returns.
FP4 vs. DeepSeek: A Cost Showdown
The crux of Microsoft’s latest AI push lies in its FP4 training framework, designed to optimize computing efficiency without compromising model performance. By improving energy consumption and computational load, FP4 seeks to lower training costs while maintaining the robustness required for LLMs.
DeepSeek, on the other hand, employs FP8 training, which also aims to reduce costs but follows a different optimization strategy. The question remains: which approach will ultimately prove more cost-effective? Microsoft argues that FP4 is a game-changer for AI economics, but DeepSeek’s success suggests that cost savings don’t necessarily require billions in infrastructure spending.
Investor Patience Wearing Thin
Wall Street is beginning to show signs of impatience. The debate over AI’s future is shifting from pure technological advancement to financial sustainability. “We really want to see a clear roadmap to monetization for all the capital that’s been invested,” said Brian Mulberry, portfolio manager at Zacks Investment Management, which holds Microsoft shares.
Even with continued investments, there are hints of restraint. Microsoft CFO Amy Hood has indicated that capital spending will remain at around $22.6 billion for the next two quarters, with growth slowing in fiscal 2026.
The Future of AI Spending
The divide between DeepSeek’s cost-efficient approach and Microsoft’s capital-heavy model highlights a broader debate in AI: Can cutting-edge models be built and deployed without the enormous financial burden tech giants have long assumed?
While Microsoft, Meta, and other Western players argue that massive infrastructure is necessary to meet growing corporate demand, DeepSeek’s unexpected rise suggests there may be another path. As AI continues to evolve, the real winner may not be who spends the most, but who spends the smartest.

AI – Cuộc chiến chi phí
Cuộc chiến về chi phí đào tạo AI đang nóng lên. Microsoft vừa tung ra một động thái mới. Tập đoàn nay đã công bố khung đào tạo FP4 và đó như một lờI tuyên bố táo bạo: việc đào tạo các mô hình ngôn ngữ lớn (LLMs) không còn làm cạn kiệt tiền bạc của các đoanh nghiệp. Nhưng điều này so với DeepSeek, một công ty khởi nghiệp Trung Quốc, các đây không lâu đã làm rung chuyển ngành công nghiệp vì cho rằng không cần nhiều tiền để làm AI. Sự thật?
Trong nhiều năm gần đây, việc huấn luyện các mô hình AI tiên tiến là rất tốn kém vì đòi hỏi tài nguyên máy tính khổng lồ và đầu tư tài chính đáng kể. Lâu nay, Microsoft và Meta (tập đoàn mẹ của Facebook – the parent group of Facebook) từ lâu đã ủng hộ cách tiếp cận này, đặt cược hàng tỷ đô la Mỹ vào việc mở rộng khả năng của AI. Nhưng DeepSeek, công ty đã cho rằng ngân sách phát triển AI của mình chỉ chưa tớI 6 triệu đô la, đang thách thức khái niệm cho rằng quy mô phải đi kèm với chi phí trên trời.
Kinh tế AI: Tiền to so với tiền nhỏ
Các tập đoàn Mỹ như Microsoft và Meta vẫn cho rằng cần bỏ ra nhiều tiền cho cơ sở hạ tầng AI. Và đó là một nhu cầu và cả lợi thế cạnh tranh. Ông Satya Nadella, Tổng giám đốc Microsoft, nhấn mạnh rằng việc tiếp tục đầu tư là chìa khóa để vượt qua các rào cản về năng lực và tận dụng nhu cầu AI. Ông Mark Zuckerberg của Meta cũng đồng tình với quan điểm này, coi đổ vốn lớn ra là một yêu cầu chiến lược dài hạn.
Cam kết của Microsoft và Meta đối với việc đổ nhiều tiền thiệt quá rõ ràng. Microsoft đã dành 80 tỷ đô la cho AI trong năm tài chính hiện hành, trong khi đó Meta dự kiến sẽ đầu tư 65 tỷ đô la. Nhưng DeepSeek lạI dùng một phương pháp tiếp cận khác. Tập đoàn Trung Quốc này cho rằng mình đã xây dựng các mô hình tương đương hoặc vượt trội hơn so với các đối thủ phương Tây, mà tốn rất ít tiền.
Sự tương phản rõ rệt giữa hai chiến lược tài chính Tây, Đông đang đặt ra câu hỏi cho các nhà đầu tư. Cổ phiếu của Microsoft đã giảm 6% sau khi Tập đoàn này báo cáo tăng trưởng chậm hơn so với mong đợi trong bộ phận đám mây Azure. Đây là một thành phần quan trọng của cơ sở hạ tầng AI của Microsoft. Hiệu suất không đồng nhất của Meta cũng đã khiến các nhà phân tích tranh luận liệu những khoản đầu tư khổng lồ vào AI có mang lại lợi nhuận như mong đợi hay không.
FP4 đụng DeepSeek: Đánh nhau vì chi phí
Điểm mấu chốt trong nỗ lực AI mới nhất của Microsoft nằm ở khung đào tạo FP4, được thiết kế để tối ưu hóa hiệu suất tính toán mà không làm giảm hiệu suất của mô hình. Bằng cách cải thiện mức tiêu thụ năng lượng và tải tính toán, mục tiêu của việc tạo ra FP4 là nhằm giảm chi phí đào tạo trong khi vẫn duy trì độ bền cần thiết cho các mô hình LLM.
DeepSeek, mặt khác, lại dùng FP8 để huấn luyện, cũng nhằm để giảm chi phí nhưng theo một chiến lược tối ưu hóa kiểu khác. Câu hỏi vẫn còn đó: cuối cùng thì phương pháp nào sẽ chứng tỏ được hiệu quả về chi phí hơn? Microsoft lập luận rằng FP4 là một bước ngoặt trong kinh tế AI, nhưng thành công của DeepSeek – khác tiết kiệm – cho thấy rằng không nhất thiết phải cần hàng tỷ đô la đầu tư vào cơ sở hạ tầng.
Nhà đầu tư mất dần kiên nhẫn
Phố Wall đang bắt đầu tỏ ra thiếu kiên nhẫn. Cuộc tranh luận về tương lai của AI đang chuyển từ sự tiến bộ công nghệ thuần túy sang sự bền vững tài chính. “Chúng tôi thực sự muốn thấy một lộ trình rõ ràng để kiếm tiền từ tất cả các khoản đầu tư đã được thực hiện,” ông Brian Mulberry, quản lý danh mục đầu tư tại Zacks Investment Management, nơi đang nắm giữ cổ phiếu của Microsoft, cho biết.
Ngay cả với các khoản đầu tư tiếp tục được dưa vào, vẫn thấy xuất hiện những dấu hiệu kiềm chế. Giám đốc Tài chính của Microsoft, bà Amy Hood, chỉ ra rằng chi tiêu vốn sẽ duy trì ở mức khoảng 22,6 tỷ đô la trong hai quý tới, và qua năm tài chính 2026 thì sẽ ít đầu tư vào đó hơn.
Tương Lai của việc chi tiền
Sự khác biệt giữa cách tiếp cận tiết kiệm chi phí của DeepSeek và mô hình nặng về vốn của Microsoft đã làm nổi lên cuộc tranh luận rộng hơn trong lĩnh vực AI. Đó là liệu các mô hình tiên tiến có thể được xây dựng và triển khai mà không cần đến những số tiền khổng lồ mà lâu nay những đại gia công nghệ đã phải gánh chịu hay không?
Trong khi Microsoft, Meta và các tập đoàn phương Tây khác lập luận rằng cơ sở hạ tầng khổng lồ là cần thiết để đáp ứng nhu cầu ngày càng tăng củadoanh nghiệp, sự trỗi dậy bất ngờ của DeepSeek cho thấy có thể xuất hiện một con đường khác. Khi AI tiếp tục phát triển, người chiến thắng thực sự có thể không phải là người chi tiêu nhiều nhất, mà là người chi tiêu thông minh nhất.