Gã khổng lồ công nghệ Google đã chính thức tung ra Gemini, mẫu trí tuệ nhân tạo mới nhất mà họ tuyên bố đã vượt qua GPT-4 của OpenAI.

Vào ngày 6 tháng 12, Giám đốc điều hành Google Sundar Pichai và Giám đốc điều hành và đồng sáng lập Google DeepMind Demis Hassabis đã thông báo về việc ra mắt Gemini trong một bài đăng trên blog của công ty

Mô hình AI đã được tối ưu hóa cho các kích cỡ và trường hợp sử dụng khác nhau (Ultra, Pro, Nano) và được xây dựng theo mô hình đa phương thức để hiểu và kết hợp các loại thông tin khác nhau.

Mô hình này cũng tiên tiến về toán học và mã hóa chuyên biệt, so với GPT-4 của OpenAI, không thể thực hiện toán học.

Trong khi đó, Google tuyên bố phiên bản Ultra của họ đạt được “hiệu suất tiên tiến” trên 30 trên 32 điểm chuẩn học thuật được sử dụng trong phát triển LLM (mô hình ngôn ngữ lớn).

Hơn nữa, nó đạt 90% trong bài kiểm tra hiểu ngôn ngữ đa nhiệm (MMLU) quy mô lớn, vượt qua hiệu suất của chuyên gia con người, theo Google.

Nhà khoa học trưởng của Google, Jeff Dean, cho biết Gemini Ultra là mô hình đầu tiên “đạt được hiệu suất con người-chuyên gia trên MMLU trên 57 môn học với số điểm trên 90%”.

Hệ thống này cũng đã được thiết kế từ đầu để xử lý liền mạch các văn bản, hình ảnh, âm thanh, video, giúp hệ thống đi trước một bước so với các đối thủ cạnh tranh.

Dean cho biết: “Chúng tôi đã thiết kế Gemini để trở nên đa phương thức ngay từ đầu thay vì bắt đầu với một mô hình văn bản thuần túy và sau đó ghép vào các bộ mã hóa hình ảnh và âm thanh”.

Minh họa khả năng đa phương thức của Gemini. Nguồn: X/@JeffDean

Gemini cũng có các kỹ năng lập trình nâng cao, bao gồm tạo mã chất lượng cao bằng AlphaCode 2, một hệ thống tạo mã tiên tiến. Nó cũng có thể giải quyết các vấn đề lập trình phức tạp và cộng tác với các nhà phát triển.

Theo chuyên gia AI Rowan Cheung, Gemini Pro vượt trội hơn GPT-3.5 ở sáu trên tám điểm chuẩn, “khiến nó trở thành chatbot miễn phí mạnh mẽ nhất trên thị trường hiện nay”.

So sánh hiệu suất của Gemini và ChatGPT. Nguồn: Google

Đối với những người muốn thử nghiệm mô hình AI mới, một phiên bản tinh chỉnh của Gemini Pro đã được triển khai cho phiên bản ChatGPT của Google – được gọi là Bard – theo Google.

“Đây là bản nâng cấp lớn nhất của Bard kể từ khi nó ra mắt. Nó sẽ có sẵn bằng tiếng Anh ở hơn 170 quốc gia và vùng lãnh thổ, đồng thời chúng tôi có kế hoạch mở rộng sang các phương thức khác nhau cũng như hỗ trợ các ngôn ngữ và địa điểm mới trong tương lai gần,” công ty cho biết.

Gemini cũng đang tung ra điện thoại hàng đầu của Google, Pixel 8 Pro.

“Pixel 8 Pro là điện thoại thông minh đầu tiên được thiết kế để chạy Gemini Nano, hỗ trợ các tính năng mới như Tóm tắt trong ứng dụng Ghi âm và triển khai trong Trả lời thông minh trong Gboard, bắt đầu với WhatsApp — với nhiều ứng dụng nhắn tin hơn sẽ ra mắt vào năm tới,” hãng cho biết.

Nó sẽ được triển khai trên nhiều sản phẩm và dịch vụ khác của Google như Tìm kiếm, Quảng cáo và Chrome “trong những tháng tới”.

Gã khổng lồ công nghệ cũng đã bắt đầu thử nghiệm Gemini để cung cấp năng lượng cho công cụ tìm kiếm thống trị web của mình nhằm giúp việc tìm kiếm trở thành một trải nghiệm tổng quát.

Google đã tiết lộ Gemini vào đầu năm nay để giới thiệu các khả năng của nó và tuyên bố rằng nó sẽ mạnh hơn ChatGPT.