
Năm ngoái, doanh nghiệp bán lẻ khổng lồ của Amazon đã gặp phải vấn đề lớn: Không thể đủ chip AI thực hiện các công việc quan trọng. Theo nhiều tài liệu của Amazon mà Business Insider có được, do các dự án bị trì hoãn, hoạt động thương mại điện tử lớn nhất phương Tây đã tiến hành cải tổ toàn diện quy trình nội bộ và công nghệ để giải quyết vấn đề. Sáng kiến cho thấy góc nhìn hiếm hoi về cách một gã khổng lồ công nghệ cân bằng nhu cầu GPU nội bộ với nguồn cung từ Nvidia và một số nhà cung cấp khác.
Đầu năm 2024, cơn sốt AI tạo sinh diễn ra mạnh mẽ, với hàng nghìn công ty cạnh tranh tiếp cận cơ sở hạ tầng cần thiết. Theo các tài liệu nội bộ, tại Amazon, một số nhân viên không bảo đảm lượng GPU trong nhiều tháng, dẫn đến sự chậm trễ của nhiều dự án quan trọng.
Vào tháng 7, Amazon ra mắt Dự án Greenland, một “nhóm năng lực GPU tập trung” chuyên quản lý và phân bổ nguồn cung chip. Công ty cũng thắt chặt các giao thức phê duyệt cho việc sử dụng GPU nội bộ.
“GPU quá giá trị. Việc phân phối nên được xác định dựa trên ROI và đảm bảo sự tăng trưởng dài hạn của dòng tiền tự do”, hướng dẫn nêu rõ.
Hai năm sau tình trạng thiếu hụt toàn cầu, GPU vẫn là một mặt hàng khan hiếm —ngay cả đối với một số công ty AI lớn nhất. Ví dụ, CEO của OpenAI, Sam Altman, đã nói vào tháng 2 rằng nhà sản xuất ChatGPT đã “hết GPU” sau khi ra mắt một mẫu máy mới. Nvidia, nhà cung cấp GPU thống trị, cũng gặp tình trạng nguồn cung hạn chế trong năm nay.
Tuy nhiên, nỗ lực của Amazon nhằm giải quyết vấn đề đang được đền đáp. Đến tháng 12, các dự báo nội bộ cho thấy tình hình sẽ bớt căng thẳng hơn trong năm nay. Khả năng cung cấp chip dự kiến cũng được cải thiện.
Trong email gửi tới BI, người phát ngôn của Amazon cho biết bộ phận bán lẻ của công ty, nơi cung cấp GPU thông qua Amazon Web Services hiện có toàn quyền truy cập vào bộ xử lý AI.
“Amazon có đủ năng lực GPU để tiếp tục đổi mới. AWS đã sớm nhận ra rằng các cải tiến AI tạo ra đang thúc đẩy việc áp dụng nhanh chóng dịch vụ điện toán đám mây cho tất cả khách hàng, bao gồm cả Amazon. Chúng tôi đã nhanh chóng đánh giá nhu cầu GPU ngày càng tăng của khách hàng và thực hiện các bước để thúc đẩy đổi mới”, đại diện Amazon nói.
Các sáng kiến phân bổ GPU dựa trên một số yếu tố, bao gồm tính đầy đủ của dữ liệu được cung cấp và lợi ích tài chính cho mỗi GPU. Một tài liệu nội bộ từ cuối năm 2024 nêu rõ rằng đơn vị bán lẻ của Amazon có kế hoạch phân phối GPU cho các sáng kiến có mức độ ưu tiên cao nếu có thêm nguồn cung vào quý đầu tiên của năm 2025.
Một trong những tài liệu bổ sung thêm rằng ưu tiên lớn hơn đối với hoạt động bán lẻ của Amazon là đảm bảo chi tiêu cho cơ sở hạ tầng đám mây tạo ra lợi tức đầu tư cao nhất thông qua tăng trưởng doanh thu hoặc giảm chi phí phục vụ.

CEO Andy Jassy
Amazon đã khởi động một dự án mới có tên là Greenland vào năm ngoái để giải quyết sự phức tạp trong việc quản lý cung và cầu GPU. Greenland được mô tả là nền tảng điều phối GPU tập trung, giúp chia sẻ năng lực GPU giữa các nhóm và tối đa hóa việc sử dụng. Hệ thống cũng cung cấp thiết lập mạng đơn giản hóa và cập nhật bảo mật, đồng thời cảnh báo nhân viên và lãnh đạo về các dự án có mức sử dụng GPU thấp.
Hoạt động bán lẻ của Amazon không lãng phí thời gian để đưa GPU vào hoạt động. Một tài liệu đã liệt kê hơn 160 sáng kiến hỗ trợ AI, bao gồm trợ lý mua sắm Rufus và trình tạo hình ảnh sản phẩm Theia.
Theo tài liệu, các dự án AI khác đang được triển khai bao gồm:
- -Dịch vụ lấy hàng hỗ trợ thị giác (VAPR) sử dụng công nghệ thị giác máy tính giúp tài xế nhanh chóng xác định và lấy đúng hàng từ xe tải tại các điểm dừng giao hàng.
- -Dịch vụ tự động lấy dữ liệu từ các trang web bên ngoài để tạo thông tin sản phẩm thống nhất.
- -Mô hình AI mới giúp tối ưu hóa lộ trình của tài xế và xử lý gói hàng để giảm thời gian giao hàng và nâng cao hiệu quả.
- -Nhân viên dịch vụ khách hàng được cải tiến, sử dụng ngôn ngữ tự nhiên để giải quyết các thắc mắc về việc trả hàng của khách hàng.
- -Dịch vụ tự động hóa việc điều tra gian lận của người bán và xác minh tính tuân thủ của tài liệu.
Năm ngoái, Amazon ước tính rằng các khoản đầu tư AI của doanh nghiệp bán lẻ đã gián tiếp đóng góp 2,5 tỷ USD vào lợi nhuận hoạt động, từ đó tiết kiệm khoảng 670 triệu USD chi phí biến đổi.
Không rõ ngân sách ước tính năm 2025 là bao nhiêu, song Amazon có kế hoạch tiếp tục chi mạnh tay cho AI. Tính đến đầu năm nay, bộ phận bán lẻ của Amazon dự kiến sẽ đầu tư khoảng 1 tỷ USD cho các dự án AI chạy bằng GPU. Nhìn chung, bộ phận bán lẻ dự kiến sẽ chi khoảng 5,7 tỷ USD cho cơ sở hạ tầng đám mây AWS vào năm 2025, tăng từ 4,5 tỷ USD vào năm 2024.
Năm ngoái, đơn vị bán lẻ của Amazon đã phải chịu tình trạng thiếu hụt nguồn cung hơn 1.000 máy chủ P5, máy chủ đám mây của AWS với tới 8 GPU Nvidia H100. Theo ước tính vào tháng 12, tình trạng thiếu hụt P5 dự kiến sẽ cải thiện đôi chút vào đầu năm nay.
Tuy nhiên hiện tại, Amazon không còn tình trạng thiếu GPU nữa. Chip AI Trainium do AWS tự phát triển cũng được dự kiến sẽ đáp ứng nhu cầu của bộ phận bán lẻ vào cuối năm 2025.
Khả năng cải thiện của Amazon phù hợp với nhận xét của Andy Jassy vào tháng 2, khi ông cho biết những hạn chế về GPU và máy chủ sẽ được khắc phục vào nửa cuối năm nay. Tuy nhiên, ngay cả với những nỗ lực này, vẫn có những dấu hiệu cho thấy Amazon còn lo ngại về nguồn cung GPU.
Theo: Business Insider
Lấy link