Các công ty khởi nghiệp châu Á đang cố gắng chứng minh rằng mình có thể cung cấp các giải pháp chip tốt hơn so với gã khổng lồ trong ngành Nvidia. Họ tin mức tiêu thụ năng lượng cao và thiết kế cồng kềnh của GPU sẽ để lại một khoảng trống mà những công ty mới có thể lấp đầy.
Có hai loại chip AI cơ bản. Một là chip “suy luận”, được sử dụng để vận hành các mô hình AI hiện có. Loại còn lại là chip “đào tạo”, các thành phần xử lý dữ liệu công suất cao được sử dụng để phát triển các mô hình AI mới.
Chẳng hạn, OpenAI cần hàng chục nghìn chip đào tạo để phát triển các mô hình mới của chatbot ChatGPT. Tuy nhiên, để ChatGPT có thể trả lời một câu hỏi, nó sẽ sử dụng một chip suy luận.
“Chưa ai tìm ra được kiến trúc chip hoàn hảo cho suy luận”, Toru Nishikawa, CEO của kỳ lân AI Nhật Bản Preferred Networks (PFN), nói với Nikkei Asia. “Tôi nghĩ sẽ có những thay đổi lớn về kiến trúc trong lĩnh vực này. Bất kỳ ai cung cấp sản phẩm phù hợp với mức giá thấp nhất sẽ chiến thắng”.
Thành công của Nvidia chủ yếu đến từ sự bùng nổ trong đào tạo nhờ vào khả năng của GPU trong việc xử lý số lượng lớn các phép tính song song. Tuy nhiên, GPU quá đắt và cồng kềnh để trở thành lựa chọn khả thi cho máy tính xách tay và thiết bị đeo được. Ví dụ, chip AI của Nvidia dành cho trung tâm dữ liệu có giá từ 25.000 đến 40.000 USD, cao gấp 7-8 lần so với các sản phẩm thông thường.
“Nếu chip suy luận có cùng chi phí với chip đào tạo, mô hình kinh doanh đó sẽ không bao giờ bền vững”, Nishikawa cho biết. “Chúng ta cần phát triển chip AI hoạt động trên PC”.
Các nhà phân tích đồng ý. “Có kỳ vọng rằng nhu cầu về AI trên thiết bị sẽ tăng lên trong tương lai gần và điều này đang khuyến khích các công ty đầu tư mạo hiểm tham gia vào cuộc chiến”, Kazuhiro Sugiyama, giám đốc tư vấn của công ty nghiên cứu Omdia của Anh cho biết.
Các thị trường tiềm năng cho AI trên thiết bị bao gồm PC, điện thoại thông minh, camera giám sát và máy bay không người lái.
“GPU của Nvidia chủ yếu phù hợp để đào tạo, nhưng chúng tôi đang thấy nhiều công ty mới phát triển loại chip có thể nhắm mục tiêu vào cả đào tạo và suy luận”, Sugiyama nói thêm.
Những công ty mới này bao gồm SambaNova Systems có trụ sở tại Mỹ, được Quỹ Vision của SoftBank hỗ trợ; Tenstorrent, được thành lập bởi một cựu kỹ sư của Intel; và công ty Graphcore của Anh, gần đây đã được SoftBank mua lại. Các công ty công nghệ lớn như Google, Meta và Amazon Web Services cũng đang dấn thân, chưa kể đến đối thủ AMD của Nvidia.
“Trong giai đoạn 2025 đến 2026, chúng ta sẽ thấy nhiều công ty tham gia vào thị trường”, Sugiyama nói và nói thêm rằng vấn đề lớn nhất với các sản phẩm của Nvidia là giá của chúng. “Một chip Nvidia có thể có giá 25.000 USD. Đây chính là gánh nặng đối với một công ty muốn đầu tư vào AI”.
Ngay cả các nhà cung cấp của Nvidia cũng đã nêu lên những quan ngại về giá.
“Các công ty muốn sử dụng chip của riêng họ thay vì chip Nvidia đắt tiền”, Chey Tae-won, chủ tịch SK Group tại Hàn Quốc, cho biết tại một hội nghị vào tháng 7.
“Tôi nghĩ mô hình kinh doanh do Nvidia dẫn đầu có thể bị phá vỡ”.
Theo Nikkei Asia, giá cả không phải vấn đề duy nhất. Chip Blackwell thế hệ tiếp theo của Nvidia tiêu thụ tới 1.200 watt điện.
“Vài năm trước, một con chip tiêu thụ hơn 100 watt được coi là khá cực đoan”, công ty khởi nghiệp về chip của Mỹ Esperanto Technologies gần đây đã nói với các phóng viên tại một cuộc họp báo ở Tokyo. Một số chuyên gia ước tính rằng việc đào tạo một mô hình như ChatGPT-3 sẽ tiêu thụ nhiều điện hơn mức 1.000 hộ gia đình sử dụng trong một năm.
Chính vì vậy, PFN và các đối tác, bao gồm một viện nghiên cứu quốc gia, đặt mục tiêu phát triển chip tăng tốc AI thế hệ tiếp theo vào tháng 3 năm 2027: mạnh hơn và tiêu thụ ít năng lượng hơn so với chipset B200 của Nvidia, theo Junichiro Makino, giám đốc thiết kế chip tại PFN. Nói một cách đơn giản, PFN hy vọng sẽ có thể sử dụng phần mềm để làm cho chip AI trở nên hiệu quả.
Mặc dù đây là chip đào tạo, PFN tin rằng công nghệ này cuối cùng có thể được điều chỉnh để tạo ra các giải pháp suy luận hiệu quả về mặt chi phí. “Nếu muốn tận dụng thị trường đang tăng trưởng, chúng tôi sẽ muốn có một con chip suy luận mới trong 2-3 năm tới”, Makino cho biết.
GPU chưa bao giờ được thiết kế để phục vụ cuộc cách mạng AI. Mục đích ban đầu của chúng chỉ là xác định màu sắc của hàng triệu pixel riêng lẻ trong trò chơi điện tử. Mỗi phép tính khá đơn giản, nhưng để xử lý đồ họa chuyển động nhanh ở độ phân giải cao đòi hỏi hàng nghìn lõi hoạt động đồng thời.
Các nhà nghiên cứu nhận thấy tiềm năng của GPU vào đầu những năm 2000. Kentaro Sano, trưởng nhóm nghiên cứu bộ xử lý tại viện nghiên cứu quốc gia Riken, cho biết khả năng xử lý đồng thời tốc độ cao cùng với một số cải tiến và phần mềm bổ sung của Nvidia đã biến GPU trở thành lựa chọn tốt nhất cho các nhà khoa học AI.
“Tôi không nói rằng kiến trúc của GPU hiện tại là hình thức tối ưu, song GPU là giải pháp tốt nhất cho xử lý đa mục đích so với các sản phẩm hiện có”, Sano cho biết.
Nvidia đang sản xuất chip AI tùy chỉnh. Chiến lược của công ty là điều chỉnh nền tảng phần mềm của mình để phù hợp với ứng dụng nhất định, chẳng hạn như AI hoặc xe tự lái.
“Không có khả năng Nvidia sẽ thay đổi kiến trúc của mình thành thứ gì đó hoàn toàn khác với GPU. ... Họ chỉ sản xuất cùng một loại chip và đó là lý do vì sao họ tìm thấy hiệu quả về mặt kinh tế”, ông cho biết.
Khi được hỏi về chiến lược R&D trong tương lai, Nvidia trả lời Nikkei Asia rằng “sẽ không bình luận về các sản phẩm chưa được công bố”.
Một nguồn tin trong ngành cho biết Nvidia áp dụng phương pháp tiếp cận đa mục đích và ưu tiên các chip có thể chạy nhiều AI tiên tiến. Các công ty khởi nghiệp có thể tìm được vị thế cạnh tranh bằng cách tập trung thiết kế vào các ứng dụng cụ thể.
Đó là một phần trong chiến lược tại Edgecortix, startup chip AI có trụ sở tại Nhật Bản do cựu kỹ sư Microsoft và IBM Sakyasingha Dasgupta đứng đầu. Công ty cho biết chip của mình được thiết kế riêng cho các ứng dụng AI trong môi trường hạn chế, chẳng hạn như thiết bị hoặc máy công nghiệp, hoạt động với 1/10 công suất mà GPU cần để cho mức hiệu suất tương đương.
Sugiyama ước tính Nvidia sẽ tiếp tục nắm giữ 30% đến 40% tổng thị trường chip AI, chủ yếu nhờ vào sự thống trị của mình trong lĩnh vực chip đào tạo. Điều này khiến các công ty khởi nghiệp phải cạnh tranh để giành được các lĩnh vực trong thị trường ngách.
“Nếu cách tiếp cận của ngành đối với tính toán AI thay đổi hoàn toàn, có khả năng sự thống trị của GPU sẽ kết thúc”, Sano của Riken nói song vẫn cho rằng Nvidia có lợi thế trong việc đầu tư vào các lĩnh vực công nghệ mới. Đây là một lý do khiến một số công ty khởi nghiệp coi Châu Á là khu vực chiến lược hơn so với phương Tây.
“Châu Á - Thái Bình Dương hiện đang ở vị trí rất quan trọng. Đó là một trong những lợi thế của chúng tôi”, ông Dasgupta nói.
Theo: Nikkei Asia
Lấy link