Một mô hình trí tuệ nhân tạo (AI) do Trung Quốc phát triển mang tên DeepSeek đã nhanh chóng đứng đầu danh sách tải xuống trên Apple Store, gây bất ngờ cho các nhà đầu tư và làm giảm giá cổ phiếu của một số công ty công nghệ lớn.
DeepSeek được ra mắt vào ngày 20 tháng 1, nhanh chóng gây ấn tượng với giới chuyên gia AI trước khi thu hút sự chú ý của toàn bộ ngành công nghệ – và cả thế giới. Tổng thống Mỹ Donald Trump nhận xét rằng đây là một “lời cảnh tỉnh” cho các công ty Mỹ, buộc họ phải tập trung “cạnh tranh để giành chiến thắng”. Công ty tuyên bố rằng mô hình này được xây dựng với chi phí thấp hơn nhiều so với các mô hình hàng đầu trong ngành như OpenAI, nhờ sử dụng ít chip tiên tiến hơn. Khả năng này đã khiến gã khổng lồ sản xuất chip NVIDIA mất gần 600 tỷ USD giá trị thị trường vào thứ Hai – mức sụt giảm lớn nhất trong lịch sử Mỹ chỉ trong một ngày.

DeepSeek cũng đặt ra câu hỏi về nỗ lực của Washington trong việc kiềm chế tham vọng công nghệ của Bắc Kinh – một trong những biện pháp chính là cấm xuất khẩu chip tiên tiến sang Trung Quốc. Tuy nhiên, Bắc Kinh đã tăng cường đầu tư, với Chủ tịch Tập Cận Bình tuyên bố AI là ưu tiên hàng đầu. Các công ty khởi nghiệp như DeepSeek đóng vai trò quan trọng khi Trung Quốc chuyển hướng từ sản xuất truyền thống (quần áo, nội thất) sang công nghệ cao (chip, xe điện và AI).
Ứng dụng miễn phí này hiện đang đứng đầu trên App Store của Apple, với mục tiêu “trả lời câu hỏi và cải thiện cuộc sống của bạn một cách hiệu quả”. Mô hình AI đứng sau ứng dụng – được gọi là R1 – có khoảng 670 tỷ tham số, trở thành mô hình ngôn ngữ mở lớn nhất hiện nay, theo Anil Ananthaswamy, tác giả cuốn Why Machines Learn: The Elegant Math Behind Modern AI. R1 được cho là mạnh ngang ngửa với mô hình O1 của OpenAI – mô hình hỗ trợ ChatGPT – trong các lĩnh vực toán học, lập trình và lập luận.
Giống như nhiều mô hình AI khác của Trung Quốc – chẳng hạn như Ernie của Baidu hay Doubao của ByteDance – DeepSeek được đào tạo để tránh trả lời các câu hỏi nhạy cảm về chính trị. Khi được hỏi về sự kiện tại Quảng trường Thiên An Môn ngày 4 tháng 6 năm 1989, DeepSeek không cung cấp thông tin chi tiết nào về vụ thảm sát, mà trả lời: “Xin lỗi, tôi không thể trả lời câu hỏi này. Tôi là một trợ lý AI được thiết kế để cung cấp các phản hồi hữu ích và vô hại.”
Mặc dù kiểm duyệt của chính phủ Trung Quốc được coi là một thách thức lớn trong phát triển AI, DeepSeek dường như đã được đào tạo trên một mô hình mã nguồn mở, cho phép thực hiện các nhiệm vụ phức tạp đồng thời tránh tiết lộ các thông tin nhạy cảm. Các nhà nghiên cứu tuyên bố mô hình này chỉ tốn 6 triệu USD để phát triển, con số rất nhỏ so với hàng tỷ USD mà các công ty AI tại Mỹ đã chi. DeepSeek được thành lập vào tháng 12 năm 2023 bởi Liang Wenfeng và ra mắt mô hình ngôn ngữ lớn đầu tiên vào năm sau.
Liang Wenfeng, tốt nghiệp Đại học Chiết Giang với các bằng kỹ sư điện tử và khoa học máy tính, hiện là tâm điểm chú ý quốc tế. Ông cũng là CEO của quỹ đầu cơ High-Flyer, quỹ đầu tiên tại Trung Quốc huy động được hơn 100 tỷ nhân dân tệ vào năm 2019 nhờ sử dụng AI để phân tích dữ liệu tài chính. Trong một bài phỏng vấn hiếm hoi, Liang cho rằng: “Sự ngạc nhiên của họ xuất phát từ việc chứng kiến một công ty Trung Quốc tham gia cuộc chơi với tư cách là nhà sáng tạo, không chỉ là kẻ đi sau.” Thành công của DeepSeek đã làm lung lay niềm tin rằng ngân sách lớn và chip cao cấp là con đường duy nhất để phát triển AI. Điều này tạo ra sự bất ổn cho tương lai của ngành sản xuất chip hiệu năng cao.
Vào ngày 27 tháng 1, thị trường tài chính Mỹ bị chấn động, khiến chỉ số Nasdaq giảm hơn 3% và các công ty sản xuất chip cũng bị bán tháo. Nvidia chịu ảnh hưởng nặng nề nhất khi giá cổ phiếu giảm 17% trong ngày. Sự trỗi dậy của DeepSeek là một cú hích lớn đối với chính phủ Trung Quốc, minh chứng cho khả năng công nghệ ngày càng mạnh mẽ và độc lập của quốc gia này. Tuy nhiên, chuyên gia Marina Zhang cảnh báo rằng điều này cũng có thể dẫn đến “chủ nghĩa cô lập công nghệ”.
Quốc Hùng: Việt Sóng TV