Token AI giá rẻ của Trung Quốc: Lợi thế cạnh tranh mới trong cuộc đua AI tại châu Á

Chi phí token AI đang trở thành yếu tố cạnh tranh mới trong cuộc đua trí tuệ nhân tạo. Trong khi các tập đoàn Mỹ dẫn đầu về năng lực mô hình, các công ty Trung Quốc lại thu hút doanh nghiệp châu Á bằng token giá rẻ, mở rộng cơ hội ứng dụng AI nhưng cũng đặt ra những thách thức về chất lượng, bảo mật và địa chính trị…

Cuộc cạnh tranh giữa các mô hình AI của Trung Quốc và Mỹ nhằm thu hút người dùng doanh nghiệp tại châu Á ngày càng xoay quanh token AI - đơn vị sử dụng cốt lõi quyết định chi phí vận hành các hệ thống này. Ảnh minh họa: CNA/Clara Ho
Cuộc cạnh tranh giữa các mô hình AI của Trung Quốc và Mỹ nhằm thu hút người dùng doanh nghiệp tại châu Á ngày càng xoay quanh token AI - đơn vị sử dụng cốt lõi quyết định chi phí vận hành các hệ thống này. Ảnh minh họa: CNA/Clara Ho

Trong nhiều năm qua, cuộc cạnh tranh trong lĩnh vực trí tuệ nhân tạo chủ yếu được đánh giá qua sức mạnh của các mô hình. Các tên tuổi như OpenAI, Google hay Anthropic liên tục được so sánh về khả năng suy luận, viết mã, xử lý ngôn ngữ và giải quyết các bài toán phức tạp.

Tuy nhiên, khi AI bắt đầu được triển khai trên quy mô doanh nghiệp, một câu hỏi mới xuất hiện: ai có thể sử dụng AI với chi phí đủ thấp để triển khai đại trà?

Theo các chuyên gia được CNA phỏng vấn, câu trả lời ngày càng phụ thuộc vào một yếu tố ít được chú ý hơn là token AI - đơn vị đo lường lượng dữ liệu mà hệ thống AI đọc, xử lý và tạo ra.

Mỗi câu hỏi gửi tới chatbot, mỗi bản dịch, mỗi đoạn mã lập trình, mỗi báo cáo được AI tóm tắt hay mỗi tác vụ mà AI agent thực hiện đều tiêu tốn token. Và khi AI được sử dụng ở quy mô hàng triệu tác vụ mỗi tháng, token trở thành một khoản chi phí đáng kể đối với doanh nghiệp. Chính ở điểm này, các công ty AI Trung Quốc đang nổi lên như một đối thủ cạnh tranh đáng gờm với các doanh nghiệp Mỹ.

CUỘC ĐUA AI ĐANG CHUYỂN TỪ NĂNG LỰC MÔ HÌNH SANG CHI PHÍ TOKEN

Theo dữ liệu được CNA dẫn lại từ Financial Times và bảng giá công khai của các nhà cung cấp AI, nhiều mô hình của Trung Quốc hiện có chi phí thấp hơn đáng kể so với các đối thủ Mỹ.

Các mô hình của MiniMax hay Moonshot chỉ tính phí khoảng 2-3 USD cho mỗi triệu token đầu ra. Trong khi đó, Gemini 3.5 Flash của Google có giá khoảng 9 USD, Claude Sonnet 4.5 của Anthropic khoảng 15 USD và GPT-5.5 của OpenAI lên tới 30 USD. Mức chênh lệch này tưởng như không lớn nhưng lại tạo ra khác biệt đáng kể khi doanh nghiệp vận hành AI trên quy mô lớn.

Amit Verma, Giám đốc Công nghệ sáng lập của công ty AI Neuron7.ai, ước tính một nhóm bán hàng gồm 50 nhân viên có thể sử dụng khoảng 450 triệu token mỗi tháng. Với GPT-5.5, chi phí có thể lên tới khoảng 3.150 USD/tháng, tương đương 38.000 USD mỗi năm. Con số này cao gấp hai đến ba lần so với việc sử dụng các mô hình AI Trung Quốc.

Theo các chuyên gia, lợi thế chi phí của Trung Quốc xuất phát từ nhiều yếu tố. Một phần đến từ chi phí điện năng và vận hành trung tâm dữ liệu thấp hơn. Một phần khác đến từ các khoản hỗ trợ của chính phủ cho hạ tầng AI. Quan trọng hơn, nhiều công ty Trung Quốc đã phát triển những kiến trúc mô hình giúp giảm đáng kể chi phí tính toán.

Điển hình là kiến trúc Mixture of Experts (MoE), được phổ biến rộng rãi sau thành công của DeepSeek R1. Thay vì huy động toàn bộ hệ thống để xử lý mỗi yêu cầu, mô hình MoE chỉ kích hoạt những "chuyên gia" phù hợp nhất. Cách tiếp cận này giúp giảm đáng kể lượng tài nguyên tính toán cần thiết và qua đó hạ chi phí token.

Ngoài ra, các kỹ thuật tối ưu như KV Caching cho phép hệ thống tái sử dụng thông tin đã xử lý trước đó thay vì phải đọc và tính toán lại từ đầu. Nhờ đó, các doanh nghiệp Trung Quốc đang có thêm dư địa để giảm giá trong cuộc cạnh tranh giành thị phần.

Những lợi thế này đã bắt đầu thu hút sự chú ý của thị trường. Airbnb, Thinking Machines Lab của cựu Giám đốc Công nghệ OpenAI Mira Murati và AI Singapore là một trong những tổ chức đã tích hợp mô hình Qwen của Alibaba vào hoạt động của mình.

AI AGENT KHIẾN CHI PHÍ TOKEN TRỞ THÀNH BÀI TOÁN KINH DOANH

Nếu chatbot là làn sóng AI đầu tiên thì AI agent đang được xem là giai đoạn phát triển tiếp theo. Khác với chatbot chỉ trả lời câu hỏi, AI agent có khả năng tự lập kế hoạch, tìm kiếm thông tin, kiểm chứng dữ liệu, kết nối với các phần mềm khác và tự động thực hiện nhiều bước để hoàn thành một nhiệm vụ. Chính sự chuyển dịch này đang làm thay đổi hoàn toàn bài toán chi phí.

Verma cho biết việc sử dụng AI đang chuyển từ các yêu cầu đơn lẻ sang những quy trình tác nhân phức tạp có thể bao gồm từ 50 đến 100 thao tác nội bộ cho một kết quả duy nhất.

Mỗi bước như tìm kiếm thông tin, xác thực dữ liệu, thực thi mã lệnh hay gọi công cụ bên ngoài đều tiêu tốn thêm token. Điều này khiến giá token trở thành yếu tố quan trọng hơn bao giờ hết.

Theo một báo cáo được Business Insider dẫn lại từ Anthropic, chi phí token AI trung bình của một lập trình viên doanh nghiệp sử dụng Claude Code vào khoảng 13 USD mỗi ngày, tương đương 150-250 USD mỗi tháng.

Đối với một doanh nghiệp công nghệ sở hữu 500 lập trình viên, tổng chi phí AI có thể lên tới 75.000-125.000 USD mỗi tháng, tương đương từ 900.000 USD đến 1,5 triệu USD mỗi năm.

Ông Yan Junjie (bên phải), CEO startup AI MiniMax có trụ sở tại Thượng Hải, cùng đồng sáng lập Yun Yeyi tham dự lễ niêm yết của công ty trên Sở Giao dịch Chứng khoán Hồng Kông. Ảnh: AFP/Tommy Wang
Ông Yan Junjie (bên phải), CEO startup AI MiniMax có trụ sở tại Thượng Hải, cùng đồng sáng lập Yun Yeyi tham dự lễ niêm yết của công ty trên Sở Giao dịch Chứng khoán Hồng Kông. Ảnh: AFP/Tommy Wang

Trong bối cảnh đó, các mô hình AI giá rẻ của Trung Quốc đang tạo ra sức hút đặc biệt tại những thị trường nhạy cảm về giá như Ấn Độ và Đông Nam Á.

Theo báo cáo của McKinsey, Hội đồng Phát triển Kinh tế Singapore (EDB) và Tech in Asia, 46% doanh nghiệp Đông Nam Á đã đưa AI vào quy trình vận hành và sản phẩm. Tại Ấn Độ, tỷ lệ này là 47%.

Verma cho rằng châu Á có thể trở thành khu vực đầu tiên trên thế giới triển khai AI đại trà ở quy mô công nghiệp nhờ sở hữu lực lượng lao động lớn, ngành dịch vụ phát triển và áp lực tối ưu chi phí cao.

Nếu chi phí AI giảm xuống, nhiều lĩnh vực như trung tâm chăm sóc khách hàng, logistics, thương mại điện tử, giáo dục, tài chính và phát triển phần mềm sẽ có cơ hội tăng tốc ứng dụng AI.

Tuy nhiên, các chuyên gia cũng cảnh báo rằng giá token thấp không phải lúc nào cũng đồng nghĩa với chi phí thực tế thấp hơn.

Theo Wong Qi Han, một mô hình được tối ưu cho tiếng Anh hoặc tiếng Trung có thể cần nhiều token hơn khi xử lý tiếng Việt, tiếng Indonesia hay tiếng Tamil.

Trong những trường hợp đó, một mô hình có giá niêm yết thấp hơn vẫn có thể trở nên đắt đỏ hơn nếu phải thực hiện nhiều lần hoặc cần nhiều nhân sự kiểm tra kết quả. Do đó, doanh nghiệp nên đánh giá AI dựa trên "chi phí cho một kết quả thành công" thay vì chỉ nhìn vào giá token.

LỢI THẾ GIÁ RẺ ĐI KÈM NHỮNG ĐÁNH ĐỔI VỀ CHẤT LƯỢNG VÀ ĐỊA CHÍNH TRỊ

Mặc dù đang tạo ra sức ép lớn về giá, các mô hình AI Trung Quốc vẫn chưa thể thay thế hoàn toàn các đối thủ Mỹ ở phân khúc cao cấp. Theo báo cáo của Đại học Stanford, tính đến tháng 3 năm nay, các mô hình AI hàng đầu của Mỹ vẫn duy trì lợi thế hiệu suất khoảng 2,7% so với các đối thủ Trung Quốc.

Khoảng cách này không quá lớn đối với các tác vụ đơn giản như phân loại dữ liệu, tóm tắt nội dung hay phân tích cảm xúc. Tuy nhiên, trong những lĩnh vực đòi hỏi độ chính xác và độ tin cậy cao như lập trình phức tạp, nghiên cứu khoa học hay trợ lý doanh nghiệp, sự khác biệt vẫn rất đáng kể.

Ông Dario Amodei, CEO của Anthropic, phát biểu tại Hội nghị Thượng đỉnh AI Impact Summit ở New Delhi, Ấn Độ. Ảnh: Reuters/Bhawika Chhabra
Ông Dario Amodei, CEO của Anthropic, phát biểu tại Hội nghị Thượng đỉnh AI Impact Summit ở New Delhi, Ấn Độ. Ảnh: Reuters/Bhawika Chhabra

Calvin Tan, đồng sáng lập kiêm Giám đốc Công nghệ của Pints.ai tại Singapore, cho biết các mô hình như GPT hay Claude vẫn là lựa chọn được nhiều doanh nghiệp ưu tiên khi xây dựng những ứng dụng AI đòi hỏi độ ổn định cao.

Theo ông, chatbot là một ví dụ điển hình. Các mô hình giá rẻ có thể hoạt động tốt trong một số trường hợp, nhưng việc xây dựng chatbot đủ ổn định để phục vụ khách hàng trên quy mô lớn vẫn là thách thức không nhỏ.

Ngoài yếu tố chất lượng, vấn đề bảo mật dữ liệu và địa chính trị cũng đang ngày càng được chú ý.

Năm 2025, nhiều nước phương Tây đã cảnh báo về các nguy cơ liên quan đến bảo mật dữ liệu khi sử dụng một số mô hình AI của Trung Quốc. Gần đây, các nghị sĩ Mỹ cũng đã mở cuộc điều tra đối với một số doanh nghiệp sử dụng công nghệ AI Trung Quốc.

Tại Ấn Độ, nhiều doanh nghiệp vẫn duy trì tâm lý thận trọng vì lo ngại những thay đổi chính sách trong tương lai có thể ảnh hưởng đến khả năng tiếp cận công nghệ từ Trung Quốc.

Tuy nhiên, sự phát triển mạnh của các mô hình mã nguồn mở như Qwen hay DeepSeek đang giúp xoa dịu phần nào các lo ngại này. Khi doanh nghiệp tải mô hình về và triển khai trên hạ tầng riêng, họ có thể kiểm soát tốt hơn dữ liệu cũng như quy trình vận hành.

Các chuyên gia dự báo tương lai sẽ không thuộc về riêng Mỹ hay Trung Quốc.

Thay vào đó, thị trường AI nhiều khả năng sẽ phát triển theo hướng đa mô hình. Các doanh nghiệp sẽ sử dụng GPT, Claude hoặc Gemini cho những nhiệm vụ đòi hỏi khả năng suy luận và độ tin cậy cao; lựa chọn Qwen, DeepSeek, Kimi hay MiniMax cho các tác vụ khối lượng lớn cần tối ưu chi phí; đồng thời phát triển các mô hình nội địa để đáp ứng yêu cầu về ngôn ngữ, quy định pháp lý và an ninh quốc gia.

Trong bối cảnh đó, cuộc cạnh tranh AI không còn đơn thuần là cuộc đua về sức mạnh công nghệ. Khi AI bước vào giai đoạn thương mại hóa sâu rộng, token đang dần trở thành "đơn vị tiền tệ" mới của nền kinh tế AI, và chi phí token có thể quyết định tốc độ phổ cập trí tuệ nhân tạo tại châu Á trong những năm tới.

Sắp diễn ra Tuần lễ kinh tế, tài chính và công nghệ Đà Nẵng năm 2026

Thành phố Đà Nẵng đang chuẩn bị cho một sự kiện quan trọng, Tuần lễ kinh tế, tài chính và công nghệ Đà Nẵng năm 2026 (Da Nang Business, Finance and Technology Week 2026 - DBFTW 2026). Sự kiện này không chỉ là cơ hội để Đà Nẵng quảng bá tiềm năng và lợi thế của mình mà còn là dịp để thành phố khẳng định vị thế là trung tâm đổi mới sáng tạo, công nghệ cao và tài chính quốc tế mới của Việt Nam…

Thuê bao 5G toàn cầu tăng trưởng mạnh, vượt mốc 3 tỷ

Số thuê bao di động 5G toàn cầu đã vượt mốc ba tỷ trong quý I/2026. Con số này được dự báo tiếp tục tăng trưởng mạnh, gấp đôi và đạt 6,4 tỷ thuê bao vào cuối năm 2031. Tại khu vực Đông Nam Á và Châu Đại Dương, số thuê bao được dự báo sẽ đạt khoảng 670 triệu vào năm 2031, với hơn 50% tổng số thuê bao di động sử dụng dịch vụ 5G...

Đà Nẵng ban hành nghị quyết về chính sách phát triển nguồn nhân lực vi mạch bán dẫn và trí tuệ nhân tạo

Đà Nẵng, với tầm nhìn trở thành trung tâm công nghệ hàng đầu Việt Nam, đã chính thức ban hành nghị quyết nhằm phát triển nguồn nhân lực trong lĩnh vực vi mạch bán dẫn và trí tuệ nhân tạo. Đây là một bước đi chiến lược, không chỉ nhằm thu hút nhân tài trong và ngoài nước mà còn tạo điều kiện thuận lợi cho các doanh nghiệp và tổ chức hoạt động trong lĩnh vực này.

Trên chặng đường 35 năm hình thành và phát triển, Tạp chí Kinh tế Việt Nam/VnEconomy, trước đây là Thời báo Kinh tế Việt Nam, đã không ngừng nỗ lực tập trung vào các sản phẩm báo chí chất lượng, chuyên sâu, gắn chặt với thực tiễn của doanh nghiệp, lắng nghe những khó khăn, rào cản về chính sách đang tác động đến sự phát triển của doanh nghiệp, từ đó đưa ra kiến nghị, giải pháp nhằm tháo gỡ những bất cập ở cả cấp độ chính sách vĩ mô lẫn hoạt động sản xuất kinh doanh, thực hiện sứ mệnh phản ánh và đồng hành cùng tiến trình phát triển của đất nước.

Đảng Cộng sản Việt Nam - Đại hội XIV

Đảng Cộng sản Việt Nam - Đại hội XIV

Với phương châm Đoàn kết - Dân chủ - Kỷ cương - Đột phá - Phát triển, Đại hội đại biểu toàn quốc lần thứ XIV của Đảng xác định tư duy, tầm nhìn, những quyết sách chiến lược để chúng ta vững bước tiến...

VnEconomy Interactive

VnEconomy Interactive

Interactive là một sản phẩm báo chí mới của VnEconomy vừa được ra mắt bạn đọc từ đầu tháng 3/2023 đã gây ấn tượng mạnh với độc giả bởi sự mới lạ, độc đáo. Đây cũng là sản phẩm độc quyền chỉ có trên...

VnEconomy
VnEconomy