Thành công của DeepSeek trước các đối thủ lớn hơn và lâu đời hơn đã được mô tả là có thể làm đảo lộn ngành công nghiệp trí tuệ nhân tạo (AI), tạo nên "cú đánh đầu tiên vào cuộc đua AI toàn cầu" và mở ra "kỷ nguyên mới của AI mạo hiểm".
Xây dựng
mô hình AI sánh ngang hoặc tốt hơn ChatGPT
Liang
Wenfeng, nhà sáng lập 39 tuổi của công ty khởi nghiệp AI Trung Quốc, DeepSeek
đã trở thành gương mặt đại diện cho ngành công nghệ Trung Quốc chỉ trong vài tuần
và hy vọng giúp quốc gia châu Á vượt qua vòng kiểm soát xuất khẩu ngày càng thắt
chặt do Mỹ áp đặt.
DeepSeek làm chấn động ngành công nghệ toàn cầu.
Liang đã
giữ thái độ cực kỳ kín tiếng cho đến ngày 20/1, khi ông là một trong 9 cá nhân
được yêu cầu phát biểu tại một hội nghị chuyên đề kín do Thủ tướng Trung Quốc,
Lý Cường tổ chức. Ông đã trả lời hai cuộc phỏng vấn hiếm hoi với hãng truyền
thông Trung Quốc, Waves vào năm ngoái và năm 2023, ngoài ra hầu như không xuất
hiện trước công chúng.
Hình ảnh
do đài truyền hình Trung Quốc CCTV công bố cho thấy, vẻ ngoài trẻ trung của
Liang trái ngược với các học giả tóc muối tiêu, các quan chức và giám đốc các tập
đoàn nhà nước ngồi xung quanh tại một hội nghị chuyên đề. Nhưng thực tế, Liang
được mời chia sẻ ý kiến về chính sách của chính phủ Trung Quốc thể hiện Bắc
Kinh thừa nhận vai trò của DeepSeek trước viễn cảnh có khả năng đảo ngược trật
tự AI toàn cầu.
DeepSeek
đã ra mắt trợ lý AI miễn phí vào tuần trước, mà công ty cho biết sử dụng ít dữ
liệu hơn với chi phí chỉ bằng một phần nhỏ so với các dịch vụ hiện tại, gây ra
đợt bán tháo cổ phiếu công nghệ toàn cầu.
Năm ngoái, Giám đốc điều hành Baidu, Robin Li đã phát biểu tại một hội thảo tương tự do thủ tướng Trung Quốc chủ trì. Li, người đã công bố đối thủ ChatGPT đầu tiên của Trung Quốc vào tháng 3/2023 cho biết trong cuộc trả lời phỏng vấn cùng thời điểm, Trung Quốc sẽ không bao giờ tái hiện được thành công của OpenAI do Microsoft hậu thuẫn và các công ty Trung Quốc nên tập trung vào việc áp dụng các mô hình AI hiện có cho mục đích thương mại.
Dưới sự dẫn
dắt của Liang, DeepSeek cố tình tránh xây dựng ứng dụng sao chép ChatGPT. Thay
vào đó, công ty tập trung tài năng và nguồn lực nghiên cứu vào việc tạo ra một
mô hình có thể sánh ngang hoặc tốt hơn OpenAI và hy vọng trong tương lai sẽ tiếp
tục tập trung vào các mô hình tiên tiến được các doanh nghiệp khác sử dụng để
xây dựng các sản phẩm AI hướng đến người tiêu dùng và doanh nghiệp.
Cách tiếp
cận của Liang nổi bật trong ngành công nghệ Trung Quốc vốn quen với việc tiếp
thu các sáng kiến từ nước ngoài, từ ứng dụng điện thoại thông minh đến xe điện
và nhanh chóng mở rộng quy mô, thường nhanh hơn nhiều so với các quốc gia nơi
những phát minh này lần đầu tiên được tạo ra.
"AI của
Trung Quốc không thể ở vị thế đi sau mãi mãi. Chúng ta thường nói rằng có một
khoảng cách vài năm giữa AI của Trung Quốc và Hoa Kỳ, nhưng khoảng cách thực sự
là khác biệt giữa tính độc đáo và sự bắt chước", Liang cho biết trong một
cuộc phỏng vấn với Waves hồi tháng 7 năm ngoái.
Sự tò mò
và mong muốn sáng tạo
"Trong
ba mươi năm qua, ngành công nghệ Trung Quốc chỉ nhấn mạnh vào việc kiếm tiền và
bỏ qua sự đổi mới. Sự đổi mới không chỉ được thúc đẩy bởi doanh nghiệp, mà còn
cần sự tò mò và mong muốn sáng tạo", ông Liang giải thích.
Nhà sáng lập DeepSeek, Liang Wenfeng.
DeepSeek
đã biến tất cả các mô hình của mình thành mã nguồn mở, không giống như đối thủ
OpenAI của Mỹ. Trong các mô hình nguồn mở, mã cơ sở được công khai để bất kỳ
nhà phát triển nào cũng có thể sử dụng và sửa đổi theo ý muốn.
Các cuộc
phỏng vấn của Liang cho thấy ông đã ủng hộ mã nguồn mở, điều mà những người
trong ngành công nghệ Hoa Kỳ trước đây lập luận đó là một lý do khiến Thung
lũng Silicon của Mỹ có lợi thế hơn so với các đối thủ Trung Quốc.
"Ngay cả khi OpenAI là nguồn đóng, nó cũng không thể ngăn cản những người khác bắt kịp... Nguồn mở giống như một hoạt động văn hóa, chứ không phải là một hoạt động kinh doanh... một công ty làm điều này sẽ có sức mạnh mềm", ông Liang cho biết.
Ông Liang
lớn lên ở tỉnh Quảng Đông, nơi dẫn đầu cả nước những năm 80 và 90 trong việc áp
dụng cơ chế thị trường. Liang nói rằng ông luôn được bao quanh bởi những người
coi trọng việc khởi nghiệp hơn là học hành, nhưng bản thân có thiên hướng học
thuật hơn.
Liang đăng
ký vào Đại học Chiết Giang danh giá ở tuổi 17, chuyên ngành Kỹ thuật Điện tử và
Truyền thông, trước khi theo đuổi bằng thạc sĩ Kỹ thuật Thông tin và Truyền
thông, bậc học mà ông hoàn thành vào năm 2010.
Sau đó,
Liang đồng sáng lập một quỹ đầu cơ định lượng vào năm 2015, sử dụng các thuật
toán toán học phức tạp để giao dịch thay vì phân tích của con người.
Danh mục đầu
tư của quỹ đã lên tới hơn 100 tỷ nhân dân tệ (tương đương 13,79 tỷ USD) vào cuối
năm 2021 nhưng vào tháng 4/2023 quỹ này thông báo trên tài khoản WeChat sẽ mở rộng
phạm vi hoạt động ra ngoài ngành đầu tư và tập trung nguồn lực để "khám
phá bản chất của AGI". DeepSeek được thành lập một tháng sau đó.
OpenAI định
nghĩa AGI (Trí tuệ nhân tạo tổng quát) là các hệ thống tự động vượt qua con người
trong hầu hết các nhiệm vụ có giá trị kinh tế.
Nhân viên
của DeepSeek chủ yếu là những người tốt nghiệp và nghiên cứu sinh tiến sĩ từ
các trường đại học hàng đầu của Trung Quốc, những người mà Liang tin rằng họ
thích làm việc cho DeepSeek vì công ty đang giải quyết những thách thức lớn nhất
trong lĩnh vực AI.
"Điều
thu hút những nhân tài giỏi nhất rõ ràng là giải quyết những vấn đề khó khăn nhất
của thế giới. Mục tiêu của chúng tôi vẫn là hướng tới AGI", ông Liang phát biểu hồi tháng 7/2024.
DeepSeek
là một công ty trí tuệ nhân tạo của Trung Quốc phát triển các mô hình ngôn ngữ
lớn (LLM) nguồn mở. Có trụ sở tại Hàng Châu, Chiết Giang, công ty này do quỹ đầu
cơ Trung Quốc High-Flyer sở hữu và tài trợ duy nhất, đồng sáng lập của công ty,
Liang Wenfeng, thành lập công ty vào năm 2023 và giữ chức vụ CEO.
DeepSeek
thực hiện các nhiệm vụ ở cùng cấp độ với ChatGPT, nhưng được phát triển với chi
phí thấp hơn đáng kể, 6 triệu USD, so với 100 triệu USD cho GPT-4 của OpenAI
vào năm 2023, và chỉ cần 1/10 sức mạnh tính toán của một LLM tương đương. Mô
hình AI được DeepSeek phát triển trong bối cảnh Hoa Kỳ áp đặt lệnh trừng phạt
Trung Quốc đối với chip Nvidia, nhằm hạn chế khả năng phát triển các hệ thống
AI tiên tiến của quốc gia này. Vào 1/1/2025, DeepSeek phát hành ứng dụng
chatbot miễn phí đầu tiên, đến ngày 27/1 đã vượt qua ChatGPT để trở thành ứng dụng
miễn phí được tải xuống nhiều nhất trên iOS App Store tại Hoa Kỳ và khiến giá cổ
phiếu của Nvidia giảm 18%.
Theo BGT