Cộng đồng doanh nghiệp và công nghệ Trung Quốc đang bày tỏ sự kinh ngạc cũng như lo ngại về thành tựu mới nhất của OpenAI với mô hình Sora giúp chuyển văn bản thành video, khi cạnh tranh gia tăng trong lĩnh vực trí tuệ nhân tạo tạo sinh (AI tạo sinh) và những rủi ro có thể xuất phát từ căng thẳng thương mại Mỹ - Trung.

Một lãnh đạo doanh nghiệp công nghệ Trung Quốc đã gọi Sora là “khoảnh khắc Newton”, lưu ý cách công nghệ tạo video AI học bằng cách sử dụng các định luật vật lý. Khoảnh khắc Newton ám chỉ một bước tiến lớn và quan trọng trong phát triển khoa học hoặc công nghệ, lấy tên từ nhà khoa học nổi tiếng Isaac Newton.

Một giám đốc điều hành công nghệ khác lưu ý rằng OpenAI, công ty khởi nghiệp Mỹ đứng sau Sora được Microsoft hậu thuẫn, có thể đang nghiên cứu các “vũ khí bí mật” khác làm gia tăng thêm khoảng cách giữa Mỹ với Trung Quốc trong lĩnh vực AI, do các hạn chế xuất khẩu của chính quyền Biden với bán dẫn và các thành phần cốt lõi khác cần thiết cho ứng dụng AI.

Yin Ye, Giám đốc điều hành BGI Group (tập đoàn khổng lồ về gien của Trung Quốc), cho biết khi OpenAI ra mắt ChatGPT vào năm 2022, các đối thủ về AI trong nước này cảm thấy tự tin có thể bắt kịp “vì chỉ tập trung vào ngôn ngữ và văn bản”. Sora chứng minh rằng “thế giới kỹ thuật số thực sự có thể kết hợp với các định luật vật lý trong thế giới thực”, ông nói thêm trong video được đăng lên kênh WeChat của mình.

“Tôi muốn so sánh điều này với khoảnh khắc Newton trong phát triển AI”, Yin Ye nhấn mạnh.

Zhou Hongyi, Chủ tịch kiêm Giám đốc điều hành hãng bảo mật 360 Security Technology, cho biết trên trang tiểu blog Weibo rằng khoảng cách giữa Mỹ và Trung Quốc trong phát triển AI “có thể lớn hơn” nếu OpenAI đang nghiên cứu các “vũ khí bí mật” khác.

Zhou Hongyi ước tính rằng các mô hình ngôn ngữ lớn tốt nhất của Trung Quốc, công nghệ hỗ trợ các ứng dụng AI tương tự ChatGPT, “đã tiến gần đến mức mô hình ngôn ngữ lớn GPT-3.5 nhưng vẫn còn khoảng cách 1,5 năm so với GPT-4”. OpenAI đã ra mắt mô hình ngôn ngữ lớn GPT-4 vào tháng 3.2023.

Một số doanh nhân Trung Quốc khác cho biết không muốn đánh giá quá cao khả năng của Sora.

Fang Han, Giám đốc điều hành hãng phát triển và phát hành game Kunlun Tech, nói trong một cuộc phỏng vấn với Thời báo Chứng khoán Thượng Hải: “Với các video demo do Sora cung cấp, mô hình này chưa đạt được những bước đột phá lớn trong việc hiểu biết thế giới. Khoảng cách giữa Sora và các công cụ chuyển văn bản thành video do Trung Quốc phát triển không lớn như trong lĩnh vực mô hình ngôn ngữ lớn”.

Các nhà đầu tư ở Trung Quốc dường như coi tin tức về sự xuất hiện của Sora là tín hiệu tích cực cho thị trường. Sora Index (chỉ số Sora), bao gồm 49 hãng công nghệ, giải trí và truyền thông niêm yết ở thành phố Thượng Hải cùng Thâm Quyến, tăng 11,4% hôm 19.2, ngày giao dịch đầu tiên sau kỳ nghỉ Tết Nguyên đán.

Các chuyên gia trên thị trường nhìn thấy cơ hội trong việc phát triển AI tạo sinh. Trong một báo cáo được công bố hôm 19.2, công ty tài chính Ping An Securities cho biết lĩnh vực mô hình ngôn ngữ lớn và AI tạo sinh đang phát triển nhanh chóng “sẽ tạo động lực mạnh mẽ cho sự phát triển sức mạnh tính toán ở Trung Quốc lẫn thế giới”.

Ping An Securities nói thêm rằng các ngành công nghiệp như sức mạnh tính toán, thuật toán và an ninh mạng đều sẽ được hưởng lợi.

Tuy nhiên, Ping An Securities cảnh báo có thể có “rủi ro chuỗi cung ứng” nếu Mỹ tiếp tục hạn chế xuất khẩu chip sang Trung Quốc. Theo Ping An Securities, các biện pháp trừng phạt “có thể đẩy nhanh sự trưởng thành của ngành công nghiệp chip AI ở Trung Quốc, nhưng các lựa chọn thay thế trong nước có thể không như mong đợi”.

Yin Ye (Giám đốc điều hành BGI) đặt câu hỏi liệu Trung Quốc có đủ thời gian để bắt kịp Mỹ hay không vì “nền tảng không thuận lợi của việc tách rời và gián đoạn chuỗi cung ứng”.

Chính quyền Biden đã chặn các công ty Trung Quốc tiếp cận công cụ bán dẫn tiên tiến nhất thế giới thông qua việc tăng cường hạn chế xuất khẩu sản phẩm sử dụng công nghệ có nguồn gốc từ Mỹ. Vào tháng 10.2023, Mỹ lại thắt chặt những hạn chế đó, chặn quyền tiếp cận của Trung Quốc vào các bộ xử lý đồ họa (GPU) mà Nvidia thiết kế riêng cho khách hàng quốc gia châu Á này.

Do đó, gã khổng lồ chip Mỹ phải phát triển ba GPU trung tâm dữ liệu mới cho Trung Quốc gồm H20, L20 và L2 . Tuy nhiên, Bộ trưởng Thương mại Mỹ - Gina Raimondo đã cảnh báo rằng chính quyền Biden sẽ không tán thành bất kỳ giải pháp lách luật nào để cung cấp GPU cho Trung Quốc.


Sora có khả năng tạo video rất chân thực từ văn bản

Hôm 15.2, OpenAI đã giới thiệu Sora - mô hình AI giúp tạo video dài 1 phút dựa trên gợi ý bằng văn bản của người dùng.

OpenAI thông báo: “Sora có thể tạo ra những cảnh phức tạp với nhiều nhân vật, loại chuyển động cụ thể và chi tiết chính xác về chủ đề và hậu cảnh. Chúng tôi đang dạy AI hiểu và mô phỏng thế giới vật chất chuyển động. Mục tiêu là xây dựng mô hình giúp con người giải quyết nhu cầu tương tác trong thế giới thực". Ngoài ra, OpenAI cho biết Sora có thể tạo nhiều cảnh quay trong một video.

Không chỉ tạo video dựa trên gợi ý bằng văn bản, Sora còn có thể tạo hoạt cảnh từ hình ảnh tĩnh.

Một đội ngũ OpenAI đang kiểm tra Sora theo hướng đối địch để đảm bảo rằng nó không tạo ra nội dung có hại hoặc không thích hợp, đồng thời tìm ra các lỗ hổng trong mô hình AI này. OpenAI đang cấp quyền truy cập Sora cho một nhóm chọn lọc "nghệ sĩ hình ảnh, nhà thiết kế và nhà làm phim để nhận phản hồi về cách phát triển mô hình hữu ích nhất với những người làm nghệ thuật sáng tạo". Điều này nhằm đảm bảo các chuyên gia sáng tạo có thể hưởng lợi từ Sora thay vì bị nó thay thế. Hiện chưa rõ khi nào OpenAI phát hành Sora rộng rãi để người dùng và doanh nghiệp sử dụng mô hình tạo video dựa trên văn bản này.

Dù vậy, Sam Altman (Giám đốc điều hành OpenAI) đã cho một số người cơ hội thấy ý tưởng của họ được thực hiện bằng Sora.

Doanh nhân 38 tuổi người Mỹ viết trên mạng xã hội X ngay sau khi OpenAI công bố sản phẩm mới: “Chúng tôi muốn cho bạn thấy Sora có thể làm gì. Vui lòng trả lời với các chú thích cho video bạn muốn xem và chúng tôi sẽ bắt đầu tạo ra một số video”.

Trong các video do Sam Altman chia sẻ trên X, Sora có khả năng tạo ra các video rất chân thực, giống như thật.

Việc OpenAI ra mắt Sora diễn ra hơn một năm sau thành công vang dội của chatbot AI ChatGPT, đưa công nghệ này trở thành xu hướng phổ biến và thúc đẩy sự phục hồi của cổ phiếu công nghệ.

Với khả năng tạo video tuyệt đỉnh, Sora gây lo ngại trong bối cảnh deepfake tràn lan trên internet. Đặc biệt, video giả mạo chính trị gia, nghệ sĩ nổi tiếng có thể gây tác động tiêu cực đến xã hội.

OpenAI cho biết đang phát triển các công cụ có thể phân biệt xem video có phải do Sora tạo ra hay không.

Trước khi mở rộng ra cho toàn bộ người dùng phổ thông sử dụng Sora, OpenAI sẽ tìm cách gắn nhãn video AI. Công ty tuyên bố hợp tác với các chuyên gia để đánh giá về khả năng Sora có thể tạo thông tin sai lệch, thù địch và thành kiến.

Theo MTG