DeepSeek và nỗi lo cho OpenAI
DeepSeek, một công ty trí tuệ nhân tạo (AI) của Trung Quốc, được thành lập vào năm 2023 bởi Liang Wenfeng và có trụ sở tại Hàng Châu, tỉnh Chiết Giang, vừa ra mắt chatbot miễn phí đầu tiên, DeepSeek-R1, và nhanh chóng vượt qua ChatGPT, trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của iOS tại Hoa Kỳ vào ngày 27/1. Thành công này đã dẫn đến việc giá cổ phiếu của Nvidia giảm 18%, gây ra sự xáo trộn đáng kể trong ngành công nghệ.
Theo VnEconomy, DeepSeek là công ty chuyên phát triển các mô hình ngôn ngữ lớn (LLM) mã nguồn mở và được tài trợ hoàn toàn bởi quỹ đầu tư mạo hiểm Trung Quốc High-Flyer.
DeepSeek nổi bật với cách tiếp cận mã nguồn mở, cung cấp miễn phí mã nguồn và tài liệu thiết kế của chatbot, cho phép người dùng truy cập, sử dụng và tùy chỉnh. Công ty cũng chú trọng tuyển dụng các nhà nghiên cứu AI trẻ từ các trường đại học hàng đầu Trung Quốc và mở rộng tuyển dụng ngoài lĩnh vực khoa học máy tính để đa dạng hóa kiến thức và khả năng của các mô hình.
Alibaba chạy nước rút
Không lâu sau khi DeepSeek tung chiêu, thì Alibaba cũng nhanh chóng công bố phiên bản mới của mô hình trí tuệ nhân tạo Qwen 2.5, mà họ tuyên bố có thể vượt qua DeepSeek-V3, mô hình AI đang tạo tiếng vang lớn trong ngành công nghệ.
Chưa dừng lại ở đó, không chỉ có Alibaba mà Bytedance (công ty mẹ của TikTok) cũng tham gia vào cuộc đua AI tại Trung Quốc. Chỉ 2 ngày sau khi DeepSeek R1 ra mắt, Bytedance lập tức phát hành bản nâng cấp cho mô hình AI của mình, đồng thời tuyên bố rằng vượt trội hơn GPT-o1 của OpenAI sau khi so sánh và đánh giá khả năng dựa trên bài kiểm tra AIME – một tiêu chuẩn đánh giá khả năng hiểu và phản hồi các hướng dẫn phức tạp của AI.
Nhiều “tay to” lo lắng
Nhiều hãng công nghệ Mỹ cho rằng, việc DeepSeek được phát triển với chi phí thấp chính là lợi thế cạnh tranh của giải pháp trí tuệ nhân tạo đến từ Trung Quốc. Một số chuyên gia trong lĩnh vực này thậm chí còn cho rằng, DeepSeek là một sản phẩm trí tuệ đầy kinh ngạc, và là mô hình AI độc đáo nhất của năm (2025).
Dấu hiệu “chưng cất”
Theo một số trang thông tin, OpenAI cho biết họ có bằng chứng cho thấy DeepSeek sử dụng các mô hình độc quyền của họ để đào tạo ra chatbot cạnh tranh.
Cụ thể, theo tường thuật của tờ Financial Times, OpenAI phát hiện dấu hiệu “chưng cất” mà họ nghi ngờ từ DeepSeek. Kỹ thuật này được các nhà phát triển sử dụng để đạt hiệu suất tốt hơn trên các mô hình nhỏ, bằng cách sử dụng đầu ra từ những mô hình lớn, cho phép họ có được kết quả tương tự trong các nhiệm vụ cụ thể với chi phí thấp hơn.
Đây là hoạt động phổ biến trong lĩnh vực AI nhưng nhiều khả năng thì DeepSeek vi phạm điều khoản dịch vụ của OpenAI. Công ty sở hữu ChatGPT từ chối cung cấp thông tin chi tiết về bằng chứng.
(Thảo Loan tổng hợp)