Mistral đã cố gắng tạo dấu ấn riêng bằng cách nhấn mạnh nguồn gốc châu Âu, nhận được sự ủng hộ từ Tổng thống Pháp Emmanuel Macron. Ngoài ra, công ty cũng công khai mã nguồn một số mô hình của mình, trái ngược với các sản phẩm độc quyền của OpenAI hay Google thuộc Alphabet.
Mô hình của Mistral được xây dựng để xử lý các tác vụ lý luận bằng các
ngôn ngữ châu Âu, tạo sự khác biệt so với các mô hình tập trung chủ yếu vào tiếng
Anh hoặc tiếng Trung.
Mistral được
xem là hy vọng lớn nhất của châu Âu trong việc xây dựng một đối thủ AI nội địa,
nhưng hiện vẫn đang tụt hậu về thị phần và doanh thu.
Các mô
hình suy luận sử dụng kỹ thuật "chuỗi tư duy" - một quá trình tạo ra
câu trả lời với khả năng suy luận trung gian khi giải quyết các vấn đề phức tạp.
Đây cũng có thể là hướng đi đầy triển vọng để nâng cao khả năng của AI, khi
cách tiếp cận truyền thống là xây dựng các mô hình ngôn ngữ lớn hơn bằng cách
thêm dữ liệu và sức mạnh tính toán đang bắt đầu gặp giới hạn.
Với
Mistral, được các nhà đầu tư mạo hiểm định giá 6,2 tỷ USD, việc ngành công nghiệp
chuyển hướng khỏi "mở rộng quy mô" có thể mở ra cơ hội để công ty này
đuổi kịp các đối thủ có nguồn vốn mạnh hơn. DeepSeek của Trung Quốc đã nổi lên
như một đối thủ đáng gờm vào tháng Một nhờ các mô hình AI mã nguồn mở giá rẻ,
bao gồm một mô hình suy luận.
OpenAI là
công ty đầu tiên ra mắt mô hình suy luận vào năm ngoái, tiếp theo là Google vài
tháng sau. Meta, cũng cung cấp các mô hình mã nguồn mở, chưa ra mắt mô hình suy
luận độc lập, dù họ cho biết mô hình cao cấp mới nhất của mình có khả năng suy
luận.
Mistral
đang ra mắt mô hình mã nguồn mở Magistral Small và một phiên bản mạnh hơn là
Magistral Medium dành cho khách hàng doanh nghiệp. "Tư duy tốt nhất của
con người không phải là tuyến tính - nó đan xen giữa logic, sự thấu hiểu, sự
không chắc chắn và khám phá. Các mô hình ngôn ngữ suy luận đã giúp chúng ta
tăng cường và giao phó việc tư duy phức tạp cũng như hiểu biết sâu sắc cho
AI", đại diện Mistral cho biết.
Tại Tuần lễ
công nghệ London, CEO Arthur Mensch cho biết Magistral có thể thực hiện các tác
vụ phức tạp như toán học và mã hóa. Magistral là một phần của hệ thống ngôn ngữ
lớn có trọng lượng mở của Mistral. Các nhà phát triển có thể truy cập và sửa đổi
các tham số cốt lõi của nó mà không cần đào tạo lại nhiều. Mô hình này bước vào
thị trường cạnh tranh với các đối thủ như o1 của OpenAI và R1 của DeepSeek từ
Trung Quốc.
Các công
ty Mỹ hầu hết giữ các mô hình tiên tiến của họ ở dạng độc quyền, dù một số ít
như Meta đã phát hành mô hình mã nguồn mở. Trong khi đó, các công ty Trung Quốc
từ DeepSeek đến Alibaba lại chọn con đường mã nguồn mở để thể hiện khả năng
công nghệ của mình.
Mô hình
Mistral Small hiện có sẵn để tải xuống trên nền tảng Hugging Face và có thể suy
luận bằng nhiều ngôn ngữ như tiếng Anh, Pháp, Tây Ban Nha, Ả Rập và tiếng Trung
giản thể. Được sự hỗ trợ từ Microsoft, Mistral có kế hoạch mở rộng hỗ trợ ngôn
ngữ và công khai dữ liệu mô hình.
Theo BXD