DeepSeek, một công ty trí tuệ nhân tạo có trụ sở tại Trung Quốc, vừa công bố bản nâng cấp cho chatbot AI của mình, tuyên bố có thể cung cấp logic, toán học và khả năng lập trình tổng thể được nâng cao với tỷ lệ ảo giác giảm.
Theo DeepSeek, mô hình được nâng cấp — DeepSeek-R1-0528 — đã “cải thiện đáng kể chiều sâu khả năng suy luận và suy diễn”. Startup này cho biết hiệu suất tổng thể của mô hình hiện đang “tiệm cận các mô hình hàng đầu, chẳng hạn như O3 và Gemini 2.5 Pro.”
So sánh hiệu suất của các mô hình ngôn ngữ trên sáu điểm chuẩn. Nguồn: DeepSeek
Sự ra mắt chatbot R1 của DeepSeek vào tháng 1 đã gây chấn động ngành công nghiệp AI và củng cố thêm vị thế của Trung Quốc như một cường quốc về AI. Mô hình AI đầu tiên của công ty có chi phí đào tạo 6 triệu đô la và hiệu suất tương đương với các mô hình AI hàng đầu được đào tạo với số vốn lớn hơn đáng kể.
Theo dữ liệu từ Business of Apps, DeepSeek đã được tải xuống 75 triệu lần kể từ khi ra mắt và có 38 triệu người dùng hoạt động hàng tháng (MAU) tính đến tháng Tư. Trong một vụ kiện chống độc quyền gần đây, Google ước tính rằng Gemini đã đạt 350 triệu người dùng hoạt động vào tháng 3, trong khi ChatGPT của OpenAI tuyên bố có 600 triệu người dùng hoạt động trong cùng tháng.
CUỘC ĐUA AI TRUNG-MỸ NÓNG LÊN
Chính phủ Hoa Kỳ đang lên kế hoạch hạn chế việc bán phần mềm thiết kế chip tiên tiến cho Trung Quốc. Theo báo cáo của Bloomberg, động thái này nhằm hạn chế khả năng của Trung Quốc trong việc thúc đẩy năng lực sản xuất chất bán dẫn trong nước.
Chất bán dẫn rất quan trọng đối với một loạt các công nghệ, bao gồm cả AI, nơi chúng đóng vai trò là xương sống phần cứng để đào tạo và chạy các mô hình phức tạp.
Các mô hình AI mới của Trung Quốc, chẳng hạn như T1 của Tencent và Qwen3 của Alibaba, cũng đã xuất hiện trong vài tháng đầu năm 2025, thúc đẩy cuộc đua AI.