“Chúng tôi có khoảng trống đáng kể trong công cụ, quy trình làm việc và quy trình phát triển AI”, trích bản ghi chép viết bởi tân giám đốc cơ sở hạ tầng Meta Platforms, Santosh Janardhan.
Từ chỗ là ngọn cờ đầu trong nghiên cứu AI, song sự chệch hướng chiến lược và tự mãn với mảng kinh doanh truyền thông xã hội khiến công ty mẹ Facebook trả giá bằng việc phải tái cơ cấu quy mô lớn, đồng thời thiết kế lại hoàn toàn cơ sở hạ tầng kỹ thuật nếu muốn tiếp tục giấc mơ AI tạo sinh.
Gã khổng lồ truyền thông xã hội dù đầu tư mạnh tay cho nghiên cứu AI, song lại chậm chạp trong việc ứng dụng phần cứng và phần mềm AI vào mảng kinh doanh cốt lõi, từ đó rơi vào tình trạng mất cân bằng trong cuộc đua sáng tạo ở quy mô lớn.
Chệch hướng chiến lược
Ngay từ cuối năm 2021, phòng thí nghiệm nghiên cứu AI của Meta đã xuất bản các nguyên mẫu công nghệ AI được giới chuyên gia đánh giá cao. Nhưng phải đến khi ChatGPT thu hút sự chú ý tăng vọt của nhà đầu tư, Zuckerberg mới thành lập một nhóm AI tạo sinh cấp cao mới để thúc đẩy chuyển hoá những nghiên cứu thành sản phẩm thực tế.
Giám đốc tài chính Susan Li thừa nhận vào tháng 2 rằng công ty đã không dồn tâm trí cho việc phát hành thương mại các sản phẩm AI tạo sinh, do "về cơ bản, tất cả năng lực AI của chúng tôi đều hướng tới quảng cáo, nguồn cấp dữ liệu và video ngắn".
Không chỉ vậy, công ty còn sai lầm trong việc lựa chọn con chip cho tác vụ AI. Cho đến năm ngoái, Meta vẫn chủ yếu chạy khối lượng công việc AI bằng các CPU trung tâm của công ty. Những CPU này giữ vai trò chủ lực trong lĩnh vực điện toán, được sử dụng rộng rãi ở các trung tâm dữ liệu nhiều thập kỷ trở lại đây, song chúng không tương thích với tác vụ AI.
Họ đã bỏ qua những con chip GPU, phù hợp hơn cho xử lý trí tuệ nhân tạo do có khả năng thực hiện đồng thời lượng lớn tác vụ, từ đó giảm thời gian cần thiết để xử lý hàng tỷ mẩu dữ liệu khác nhau.
Meta cũng từng thử nghiệm con chip “logic suy luận” tự thiết kế, trong đó thuật toán được đào tạo dựa trên dữ liệu để đưa ra phán đoán và tạo phản hồi. Song, cách tiếp cận này không đủ nhanh và hiệu quả như GPU.
"Bừng tỉnh"
Một nguồn tin cho biết sau khi ngừng triển khai quy mô lớn con chip suy luận tự thiết kế dự kiến ra mắt năm 2022, các giám đốc điều hành Meta đã “chốt đơn” lô hàng GPU của Nvidia trị giá hàng tỷ USD.
Vào thời điểm đó, Meta đã chậm hơn vài bước so với những đối thủ như Google, công ty vốn triển khai phiên bản GPU tuỳ chỉnh có tên TPU từ năm 2015.
Gã khổng lồ mạng xã hội cũng tiến hành tái cơ cấu các đơn vị AI, bổ nhiệm 2 người đứng đầu kỹ thuật mới. Theo hồ sơ Linkedln, hơn một chục lãnh đạo cấp cao khác đã rời Meta trong giai đoạn biến động này.
Tiếp đến, công ty trang bị lại các trung tâm dữ liệu để phù hợp với GPU mới, tiêu thụ nhiều năng lượng và sinh nhiệt nhiều hơn so với CPU. Theo tính toán, hệ thống mới cần công suất mạng gấp 24 đến 32 lần, kèm hệ thống làm mát bằng chất lỏng mới để quản lý nhiệt của các cụm, dẫn đến cơ sở hạ tầng phải được "thiết kế lại hoàn toàn".
Song song với đó, Meta lên kế hoạch nội bộ bắt đầu phát triển một con chip in-house mới tham vọng hơn, giống như GPU, có khả năng đào tạo các mô hình AI và thực hiện suy luận, dự kiến hoàn thành vào khoảng năm 2025.
Giám đốc công nghệ Meta, Andrew Bosworth cũng cho biết trong tháng này rằng AI tạo sinh là lĩnh vực mà ông và Zuckerberg dành nhiều thời gian nhất, đồng thời hé lộ việc Meta sẽ phát hành một sản phẩm trong năm nay.
Hiện Meta đang trong giai đoạn đầu phát triển mô hình nền tảng, chương trình lõi mà sau này có thể được tinh chỉnh và tích hợp vào các sản phẩm khác nhau.
(Theo Reuters)
Meta cắt giảm đội công nghệ, vùi dập tinh thần nhân viên
Ngày 19/4, Meta công ty mẹ Facebook tiến hành đợt cắt giảm nhân sự tiếp theo nhằm vào bộ phận kỹ thuật gồm các kỹ sư và các nhóm công nghệ.
Meta giới thiệu mô hình AI nhận diện hình ảnh mới
Ngày 5/4, Meta, công ty mẹ Facebook, đã giới thiệu một mô hình trí tuệ nhân tạo (AI) có khả năng nhận diện từng vật thể trong một bức hình, cùng với bộ dữ liệu chú thích hình ảnh mà công ty đánh giá là lớn nhất từ trước đến nay trong lĩnh vực này.
Meta cho biết sẽ ra mắt mô hình ngôn ngữ lớn mới cho các nhà nghiên cứu, “hâm nóng” cuộc đua AI giữa các hãng công nghệ toàn cầu.