Google mới đây đã giới thiệu TurboQuant, thuật toán nén dữ liệu giúp giảm dung lượng bộ nhớ, từ đó tối ưu chi phí vận hành các mô hình AI. Đột phá này được giới chuyên gia đánh giá có thể góp phần giải quyết bài toán “thiếu bộ nhớ” trên quy mô toàn cầu.
Theo công bố, giải pháp này có thể giúp giảm kích thước bộ nhớ đệm dùng trong các mô hình ngôn ngữ lớn (LLM) xuống ít nhất 6 lần.
Bên cạnh khả năng tiết kiệm tài nguyên, TurboQuant còn được cho là có thể cải thiện tốc độ xử lý của AI lên tới 8 lần. Điều thú vị là Google tuyên bố những cải tiến này không làm giảm độ chính xác trong suy luận của các mô hình.
Về cơ chế, TurboQuant tập trung tối ưu bộ nhớ đệm, nơi lưu trữ các thông tin được truy xuất thường xuyên để máy tính suy luận mà không phải tìm kiếm lại thông qua cơ sở dữ liệu lớn. Khi các cuộc hội thoại kéo dài, lượng dữ liệu tích lũy trong bộ nhớ này tăng nhanh, kéo theo nhu cầu RAM lớn hơn từ đó mô hình sẽ chạm ngưỡng giới hạn dữ liệu.
Đây chính là rào cản khi sử dụng mô hình AI trên các thiết bị phổ thông như điện thoại hay máy tính xách tay có phần cứng lưu trữ hạn chế. Khi tràn bộ nhớ, hệ thống AI có thể bị treo thậm chí bị sập.
Trong bối cảnh đó, TurboQuant được xem là giải pháp mang tính cấu trúc. Thay vì phụ thuộc vào nâng cấp phần cứng, công nghệ này tác động trực tiếp vào cách dữ liệu được lưu trữ, nén bộ nhớ xuống chỉ còn khoảng một phần sáu so với trước đây nhưng vẫn đảm bảo khả năng truy xuất và độ chính xác của mô hình.
Đáng chú ý hơn, công nghệ này đang được chuyển dịch sang chip Apple Silicon. Điều này có nghĩa là những mô hình AI khổng lồ vốn chỉ chạy được trên máy chủ nay có thể vận hành mượt mà ngay trên một chiếc MacBook.
Trong một bài đăng trên nền tảng X, nhóm Google Research nhận định TurboQuant có thể “định nghĩa lại hiệu quả của AI” khi đồng thời giải quyết bài toán giảm tài nguyên bộ nhớ, tăng tốc độ xử lý và duy trì độ chính xác trong suy luận.
Nếu được ứng dụng rộng rãi, TurboQuant sẽ trở thành mảnh ghép quan trọng trong tối ưu chi phí phát triển AI. Tại các trung tâm dữ liệu vốn phụ thuộc lớn vào bộ nhớ băng thông cao (HBM), việc giảm nhu cầu bộ nhớ có thể góp phần hạ áp lực lên chuỗi cung ứng phần cứng, hiện đang ảnh hưởng cả thị trường RAM tiêu dùng.
Đối với người dùng cuối như người tiêu dùng, các thiết bị phổ thông, từ điện thoại đến laptop giá rẻ, có thể vận hành những ứng dụng AI mạnh mẽ hơn mà không cần nâng cấp phần cứng đắt đỏ.



Các nhà mạng khuyến nghị người dùng dành vài phút kiểm tra điện thoại của ông bà, cha mẹ và những người lớn tuổi trong gia đình để hỗ trợ xác thực thuê bao trước ngày 15/6...
Mục tiêu này được nêu trong Dự thảo Quyết định của Thủ tướng Chính phủ về Chiến lược quốc gia về trí tuệ nhân tạo đến năm 2030, tầm nhìn đến năm 2045, vừa được Bộ Khoa học và Công nghệ đưa ra lấy ý kiến...
Ban Chỉ đạo giúp Thủ tướng Chính phủ nghiên cứu, chỉ đạo giải quyết những công việc quan trọng, liên ngành liên quan đến thúc đẩy phát triển ngành công nghiệp bán dẫn…
Đài Loan đang thúc đẩy các chính sách thu hút nhân lực quốc tế, đặc biệt trong lĩnh vực công nghệ cao, bằng cách nới lỏng các quy định về cấp phép lao động cho chuyên gia nước ngoài...
Brussels đang tiến hành cấm sử dụng nguồn tài trợ của Liên minh châu Âu (EU) cho các dự án năng lượng sạch có sử dụng biến tần (inverter) cho điện mặt trời và hệ thống lưu trữ pin đến từ các “quốc gia có rủi ro cao”, mà chủ yếu là Trung Quốc. Theo đó, các nhà phát triển dự án sẽ phải chuyển sang sử dụng các giải pháp thay thế từ châu Âu, nhưng điều này có thể khiến hóa đơn năng lượng và chi phí sản xuất tại châu Âu tăng lên.
Bức tranh kinh tế của Việt Nam trong tháng 5 và 5 tháng đầu năm 2026 ghi nhận nhiều chỉ số tăng trưởng tích cực. Điển hình như chỉ số sản xuất công nghiệp (IIP) tháng 5 tăng 8,8% so với cùng kỳ; tổng mức bán lẻ hàng hóa và doanh thu dịch vụ tiêu dùng tăng 11,8%....
Chuyển đổi xanh đang trở thành yêu cầu tất yếu nhưng cũng là thách thức lớn đối với doanh nghiệp vừa và nhỏ Việt Nam khi tham gia chuỗi cung ứng bán lẻ hiện đại. Để phát triển bền vững, các doanh nghiệp vừa và nhỏ cần được tích hợp vào toàn bộ chuỗi giá trị.