Phòng thí nghiệm có tên là DeepSeek, đã ra mắt một mô hình ngôn ngữ lớn (LLM) mã nguồn mở miễn phí vào cuối tháng 12. Công ty cho biết, LLM này chỉ mất hai tháng và chưa đến 6 triệu USD để phát triển, sử dụng các con chip H800s hiệu năng thấp hơn do Nvidia sản xuất.
Những phát triển này đã đe dọa đến vị thế dẫn đầu toàn cầu của Mỹ trong lĩnh vực trí tuệ nhân tạo (AI), cũng như đặt câu hỏi về chi phí khổng lồ mà các gã khổng lồ công nghệ đang sử dụng để phát triển mô hình AI và trung tâm dữ liệu.
Trong một loạt các bài kiểm tra tiêu chuẩn từ bên thứ ba, mô hình của DeepSeek đã vượt qua các mô hình AI hàng đầu như Meta Llama 3.1, OpenAI GPT-4o và Anthropic Claude Sonnet 3.5 về độ chính xác trong việc giải quyết các vấn đề phức tạp, toán học và lập trình.
Đầu tuần này, DeepSeek đã phát hành mô hình r1, một mô hình suy luận cũng đã vượt qua OpenAI o1 trong nhiều bài kiểm tra của bên thứ ba.
"Thật ấn tượng khi nhìn vào mô hình mới của DeepSeek, cả về cách họ đã thực hiện một mô hình mã nguồn mở rất hiệu quả trong việc xử lý các phép toán tại thời gian suy luận và cực kỳ tiết kiệm về khả năng tính toán", CEO của Microsoft Satya Nadella nói tại Diễn đàn Kinh tế Thế giới ở Davos, Thụy Sĩ. "Chúng ta phải nhìn nhận các phát triển từ Trung Quốc một cách rất nghiêm túc".
Tương tự các công ty đồng hương, DeepSeek cũng phải đối mặt với những hạn chế nghiêm ngặt về bán dẫn mà chính phủ Mỹ áp đặt đối với Trung Quốc, cắt đứt quyền truy cập vào những con chip mạnh nhất như H100 của Nvidia.
Do đó, những tiến bộ mới nhất cho thấy DeepSeek có thể đã tìm ra cách vượt qua rào cản kỹ thuật hoặc các biện pháp kiểm soát xuất khẩu của Mỹ không thực sự hiệu quả.
Chetan Puttagunta, đối tác của Benchmark General nhận định có thể công ty Trung Quốc “đã sử dụng một mô hình lớn có hiệu quả cao và cho chạy qua quy trình gọi là ‘chưng cất’”, tương tự như cách dùng mô hình lớn để giúp mô hình nhỏ trở nên thông minh hơn".
Theo các báo cáo truyền thông, DeepSeek được Liang WenFeng thành lập từ một quỹ phòng hộ Trung Quốc tên là High-Flyer Quant, quản lý khoảng 8 tỷ USD tài sản.
DeepSeek không phải là công ty Trung Quốc duy nhất có những bước tiến đáng kể trong lĩnh vực AI.
Nhà nghiên cứu AI hàng đầu Kai-Fu Lee đã chia sẻ rằng, startup 01.ai của ông đã được huấn luyện với chỉ 3 triệu USD. Công ty mẹ của TikTok, ByteDance, trong tuần vừa rồi cũng công bố một bản cập nhật cho mô hình AI của mình, tuyên bố rằng mô hình này vượt qua OpenAI’s o1 trong một bài kiểm tra tiêu chuẩn.
“Sức ép phải tìm ra phương án thay thế đã giúp những công ty AI Trung Quốc phát triển được những nền tảng hiệu quả”, CEO của Perplexity, Aravind Srinivas cho biết.