Nhà sáng lập DeepSeek có thể làm đảo lộn ngành công nghiệp AI

Thành công của DeepSeek trước các đối thủ lớn hơn và lâu đời hơn đã được mô tả là có thể làm đảo lộn ngành công nghiệp trí tuệ nhân tạo (AI), tạo nên "cú đánh đầu tiên vào cuộc đua AI toàn cầu" và mở ra "kỷ nguyên mới của AI mạo hiểm".

Xây dựng mô hình AI sánh ngang hoặc tốt hơn ChatGPT

Liang Wenfeng, nhà sáng lập 39 tuổi của công ty khởi nghiệp AI Trung Quốc, DeepSeek đã trở thành gương mặt đại diện cho ngành công nghệ Trung Quốc chỉ trong vài tuần và hy vọng giúp quốc gia châu Á vượt qua vòng kiểm soát xuất khẩu ngày càng thắt chặt do Mỹ áp đặt.

DeepSeek làm chấn động ngành công nghệ toàn cầu.

Liang đã giữ thái độ cực kỳ kín tiếng cho đến ngày 20/1, khi ông là một trong 9 cá nhân được yêu cầu phát biểu tại một hội nghị chuyên đề kín do Thủ tướng Trung Quốc, Lý Cường tổ chức. Ông đã trả lời hai cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc, Waves vào năm ngoái và năm 2023, ngoài ra hầu như không xuất hiện trước công chúng.

Hình ảnh do đài truyền hình Trung Quốc CCTV công bố cho thấy, vẻ ngoài trẻ trung của Liang trái ngược với các học giả tóc muối tiêu, các quan chức và giám đốc các tập đoàn nhà nước ngồi xung quanh tại một hội nghị chuyên đề. Nhưng thực tế, Liang được mời chia sẻ ý kiến về chính sách của chính phủ Trung Quốc thể hiện Bắc Kinh thừa nhận vai trò của DeepSeek trước viễn cảnh có khả năng đảo ngược trật tự AI toàn cầu.

DeepSeek đã ra mắt trợ lý AI miễn phí vào tuần trước, mà công ty cho biết sử dụng ít dữ liệu hơn với chi phí chỉ bằng một phần nhỏ so với các dịch vụ hiện tại, gây ra đợt bán tháo cổ phiếu công nghệ toàn cầu.

Năm ngoái, Giám đốc điều hành Baidu, Robin Li đã phát biểu tại một hội thảo tương tự do thủ tướng Trung Quốc chủ trì. Li, người đã công bố đối thủ ChatGPT đầu tiên của Trung Quốc vào tháng 3/2023 cho biết trong cuộc trả lời phỏng vấn cùng thời điểm, Trung Quốc sẽ không bao giờ tái hiện được thành công của OpenAI do Microsoft hậu thuẫn và các công ty Trung Quốc nên tập trung vào việc áp dụng các mô hình AI hiện có cho mục đích thương mại.

Dưới sự dẫn dắt của Liang, DeepSeek cố tình tránh xây dựng ứng dụng sao chép ChatGPT. Thay vào đó, công ty tập trung tài năng và nguồn lực nghiên cứu vào việc tạo ra một mô hình có thể sánh ngang hoặc tốt hơn OpenAI và hy vọng trong tương lai sẽ tiếp tục tập trung vào các mô hình tiên tiến được các doanh nghiệp khác sử dụng để xây dựng các sản phẩm AI hướng đến người tiêu dùng và doanh nghiệp.

Cách tiếp cận của Liang nổi bật trong ngành công nghệ Trung Quốc vốn quen với việc tiếp thu các sáng kiến từ nước ngoài, từ ứng dụng điện thoại thông minh đến xe điện và nhanh chóng mở rộng quy mô, thường nhanh hơn nhiều so với các quốc gia nơi những phát minh này lần đầu tiên được tạo ra.

"AI của Trung Quốc không thể ở vị thế đi sau mãi mãi. Chúng ta thường nói rằng có một khoảng cách vài năm giữa AI của Trung Quốc và Hoa Kỳ, nhưng khoảng cách thực sự là khác biệt giữa tính độc đáo và sự bắt chước", Liang cho biết trong một cuộc phỏng vấn với Waves hồi tháng 7 năm ngoái.

Sự tò mò và mong muốn sáng tạo

"Trong ba mươi năm qua, ngành công nghệ Trung Quốc chỉ nhấn mạnh vào việc kiếm tiền và bỏ qua sự đổi mới. Sự đổi mới không chỉ được thúc đẩy bởi doanh nghiệp, mà còn cần sự tò mò và mong muốn sáng tạo", ông Liang giải thích.

Nhà sáng lập DeepSeek, Liang Wenfeng.

DeepSeek đã biến tất cả các mô hình của mình thành mã nguồn mở, không giống như đối thủ OpenAI của Mỹ. Trong các mô hình nguồn mở, mã cơ sở được công khai để bất kỳ nhà phát triển nào cũng có thể sử dụng và sửa đổi theo ý muốn.

Các cuộc phỏng vấn của Liang cho thấy ông đã ủng hộ mã nguồn mở, điều mà những người trong ngành công nghệ Hoa Kỳ trước đây lập luận đó là một lý do khiến Thung lũng Silicon của Mỹ có lợi thế hơn so với các đối thủ Trung Quốc.

"Ngay cả khi OpenAI là nguồn đóng, nó cũng không thể ngăn cản những người khác bắt kịp... Nguồn mở giống như một hoạt động văn hóa, chứ không phải là một hoạt động kinh doanh... một công ty làm điều này sẽ có sức mạnh mềm", ông Liang cho biết.

Ông Liang lớn lên ở tỉnh Quảng Đông, nơi dẫn đầu cả nước những năm 80 và 90 trong việc áp dụng cơ chế thị trường. Liang nói rằng ông luôn được bao quanh bởi những người coi trọng việc khởi nghiệp hơn là học hành, nhưng bản thân có thiên hướng học thuật hơn.

Liang đăng ký vào Đại học Chiết Giang danh giá ở tuổi 17, chuyên ngành Kỹ thuật Điện tử và Truyền thông, trước khi theo đuổi bằng thạc sĩ Kỹ thuật Thông tin và Truyền thông, bậc học mà ông hoàn thành vào năm 2010.

Sau đó, Liang đồng sáng lập một quỹ đầu cơ định lượng vào năm 2015, sử dụng các thuật toán toán học phức tạp để giao dịch thay vì phân tích của con người.

Danh mục đầu tư của quỹ đã lên tới hơn 100 tỷ nhân dân tệ (tương đương 13,79 tỷ USD) vào cuối năm 2021 nhưng vào tháng 4/2023 quỹ này thông báo trên tài khoản WeChat sẽ mở rộng phạm vi hoạt động ra ngoài ngành đầu tư và tập trung nguồn lực để "khám phá bản chất của AGI". DeepSeek được thành lập một tháng sau đó.

OpenAI định nghĩa AGI (Trí tuệ nhân tạo tổng quát) là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.

Nhân viên của DeepSeek chủ yếu là những người tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu của Trung Quốc, những người mà Liang tin rằng họ thích làm việc cho DeepSeek vì công ty đang giải quyết những thách thức lớn nhất trong lĩnh vực AI.

"Điều thu hút những nhân tài giỏi nhất rõ ràng là giải quyết những vấn đề khó khăn nhất của thế giới. Mục tiêu của chúng tôi vẫn là hướng tới AGI", ông Liang phát biểu hồi tháng 7/2024.

DeepSeek là một công ty trí tuệ nhân tạo của Trung Quốc phát triển các mô hình ngôn ngữ lớn (LLM) nguồn mở. Có trụ sở tại Hàng Châu, Chiết Giang, công ty này do quỹ đầu cơ Trung Quốc High-Flyer sở hữu và tài trợ duy nhất, đồng sáng lập của công ty, Liang Wenfeng, thành lập công ty vào năm 2023 và giữ chức vụ CEO.

DeepSeek thực hiện các nhiệm vụ ở cùng cấp độ với ChatGPT, nhưng được phát triển với chi phí thấp hơn đáng kể, 6 triệu USD, so với 100 triệu USD cho GPT-4 của OpenAI vào năm 2023, và chỉ cần 1/10 sức mạnh tính toán của một LLM tương đương. Mô hình AI được DeepSeek phát triển trong bối cảnh Hoa Kỳ áp đặt lệnh trừng phạt Trung Quốc đối với chip Nvidia, nhằm hạn chế khả năng phát triển các hệ thống AI tiên tiến của quốc gia này. Vào 1/1/2025, DeepSeek phát hành ứng dụng chatbot miễn phí đầu tiên, đến ngày 27/1 đã vượt qua ChatGPT để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên iOS App Store tại Hoa Kỳ và khiến giá cổ phiếu của Nvidia giảm 18%.

BGT

Nhà sáng lập DeepSeek có thể làm đảo lộn ngành công nghiệp AI

Tags:

Tin liên quan