Kỹ sư Việt và hành trình 4 tháng hoàn thiện AI trên điện thoại hiện đại nhất

Thu âm hàng triệu tệp giọng nói, huy động hàng trăm người xử lý dữ liệu, từ con số 0 chỉ trong 4 tháng, các kỹ sư người Việt đã hoàn thiện AI tiếng Việt cho điện thoại hiện đại nhất hiện nay.


Tại buổi làm việc với Bộ trưởng Bộ TT&TT Nguyễn Mạnh Hùng vào chiều 4/4, Tổng Giám đốc Tổ hợp Samsung Việt Nam Choi Joo Ho tiết lộ, Galaxy S24 lần đầu tích hợp các tính năng trí tuệ nhân tạo (AI) do chính các kỹ sư Việt Nam chủ động nghiên cứu, phát triển.


Ngày 10/4, chúng tôi đã có cuộc trao đổi với nhóm kỹ sư người Việt này. Rất tự hào giữ vai trò trưởng nhóm nghiên cứu Language AI, kỹ sư Trần Tuấn Minh, Trung tâm Nghiên cứu và Phát triển Samsung Việt Nam cho biết, tháng 10/2023, lãnh đạo tập đoàn đã quyết định bổ sung thêm tiếng Việt vào Galaxy AI, ngôn ngữ thứ 13 sau các ngôn ngữ phổ biến trên thế giới như Anh, Trung, Pháp, Hàn…


W-minh1-1.jpeg
Kỹ sư Trần Tuấn Minh kể lại hành trình hoàn thiện AI trên điện thoại hiện đại nhất. Ảnh: N. Huyền

“Tôi vẫn nhớ cảm giác sung sướng khi được chọn vào đội AI. Vì đây là lần đầu tiên Trung tâm Nghiên cứu và phát triển Samsung Việt Nam (SRV) được nhận một dự án chiến lược liên quan đến AI.


Đặc biệt hơn nữa, tôi cảm thấy vô cùng tự hào khi được phát triển ngôn ngữ Tiếng Việt, là ngôn ngữ mẹ đẻ của quốc gia mình, trên dòng điện thoại hiện đại bậc nhất bây giờ”, Minh cười nói.


Ngay sau đó, các kỹ sư trong nhóm nghiên cứu và phát triển AI được cử sang Hàn Quốc và Ấn Độ để nhận chuyển giao về kiến trúc mô hình AI, thuật toán cho AI, đào tạo AI, dữ liệu cho AI…. Bộ phận kiểm thử về AI cũng được Hàn Quốc trực tiếp sang chia sẻ: kiến thức về AI, phương pháp kiểm thử, Tool hỗ trợ kiểm thử, kinh nghiệm kiểm thử AI.


Thu âm hàng triệu tệp giọng nói, hàng trăm người xử lý dữ liệu


Tuy nhiên khi bắt tay vào thực hiện nhóm nghiên cứu cũng đối diện không ít khó khăn. Theo đó, để phát triển AI có chất lượng cao, nguồn dữ liệu lớn, đa dạng và được kiểm soát là những điều kiện tiên quyết. Thế nhưng so sánh với dữ liệu các ngôn ngữ phổ biến trên thế giới như tiếng Anh, tiếng Trung Quốc… thì nguồn dữ liệu tiếng Việt lại ít hơn rất nhiều.


“Đây chính là khó khăn lớn nhất mà chúng tôi phải đối mặt. Bên cạnh cấu trúc ngữ pháp tiếng Việt rất khó thì chúng tôi còn đối diện với khó khăn như ngôn ngữ các vùng miền, từ lóng, từ đồng nghĩa, từ mượn và những từ mới của thế hệ GenZ…


Để giải quyết những vấn đề này, SRV phải huy động hàng trăm người để xử lý dữ liệu cho AI. Chúng tôi phải liên tục tạo ra dữ liệu để đào tạo AI, giúp AI hiểu và cho kết quả đầu ra chính xác. Đặc biệt, những nguồn dữ liệu này phải đảm bảo tính hợp pháp chứ không đơn thuần là dữ liệu thu thập tự do”, Tuấn Minh nói.


Nhờ sự tập trung cao độ và huy động nguồn lực lớn cho dự án, chỉ trong một thời gian rất ngắn, nhóm kỹ sư người Việt đã vừa hiệu chỉnh dữ liệu sẵn có vừa tạo thêm nhiều dữ liệu mới để phục vụ đào tạo cho AI.


Tuấn Minh tiết lộ để hoàn thiện AI, nhóm kỹ sư đã phải thu âm hàng triệu tệp giọng nói của cả nam lẫn nữ để giúp Galaxy S24 Series thông minh hơn với người Việt Nam.


Riêng về công tác kiểm thử, để đảm bảo tính năng dịch chính xác và mức độ nhận giọng nói trong các môi trường tiếng ồn khác nhau, nhóm kỹ sư không chỉ thực hiện kiểm thử trong môi trường phòng lab, mà còn đi đến nhiều địa điểm như Hồ Gươm, trung tâm thương mại, quán café để tính năng AI hoạt động tốt trong môi trường người dùng thực.


“Nhờ những nỗ lực không ngừng nghỉ, chỉ trong vòng 4 tháng, từ con số 0, các kỹ sư của SRV đã tự mình làm chủ công nghệ và hoàn thiện AI cho tiếng Việt cho dòng sản phẩm S24”, Trần Tuấn Minh tự hào.


W-dung-1-1.jpeg
Ông Đỗ Đức Dũng: "Galaxy AI không phải dự án toàn cầu đầu tiên mà các kỹ sư người Việt Nam tham gia". Ảnh: N. Huyền

Được biết, AI đã được các kỹ sư Việt Nam ứng dụng trong việc nhận giọng nói và chuyển đổi giọng nói sang văn bản(text). Theo đó, thiết bị Galaxy AI tự động nhận diện ngôn ngữ người dùng đang sử dụng thông qua tự động nhận diện giọng nói, sau đó nội dung giọng nói (Speech) sẽ chuyển sang dạng văn bản (Text). Ngoài ra có thể dùng AI để chuyển văn bản (Text) sang giọng nói. Đầu vào là văn bản (đã được dịch), đầu ra là âm thanh đọc ra từ văn bản đó.


Song song đó, đóng góp của đội ngũ kỹ sư Việt cho tính năng AI ở phần ngôn ngữ tiếng Việt còn là phát triển và hoàn thiện nhiều tính năng thông minh ở phần mềm chỉnh sửa ảnh trên điện thoại di động (Photo Editor) như: di chuyển vật thể sang vị trí khác trong ảnh. Thiết bị sẽ tự phân tích, xóa, đặt lại vị trí các đối tượng trong hình ảnh, và tái tạo lại phần hình ảnh còn thiếu sau khi xóa đối tượng.


Mở rộng ảnh: thiết bị sẽ tái tạo phần hình khi có thay đổi kích thước, căn chỉnh bố cục, những phần hình nền còn thiếu sẽ được lấp đầy một cách hoàn hảo và thậm chí nội dung vượt ra ngoài đường viền của hình ảnh gốc, giúp mở rộng vùng hiển thị của ảnh. Nâng cao độ phân giải của hình ảnh: giúp nâng cao độ phân giải của hình ảnh mà không làm giảm chất lượng.









Ky su Viet va hanh trinh 4 thang hoan thien AI tren dien thoai hien dai nhat


Thu am hang trieu tep giong noi, huy dong hang tram nguoi xu ly du lieu, tu con so 0 chi trong 4 thang, cac ky su nguoi Viet da hoan thien AI tieng Viet cho dien thoai hien dai nhat hien nay.

Kỹ sư Việt và hành trình 4 tháng hoàn thiện AI trên điện thoại hiện đại nhất

Thu âm hàng triệu tệp giọng nói, huy động hàng trăm người xử lý dữ liệu, từ con số 0 chỉ trong 4 tháng, các kỹ sư người Việt đã hoàn thiện AI tiếng Việt cho điện thoại hiện đại nhất hiện nay.
Kỹ sư Việt và hành trình 4 tháng hoàn thiện AI trên điện thoại hiện đại nhất
www.tincongnghe.net
Giới thiệu cho bạn bè
  • gplus
  • pinterest

Bình luận

Đăng bình luận

Đánh giá: