Ngày 19/5 vừa qua, tại hội nghị I/O dành cho các nhà phát triển phần mềm, Google thông báo, chỉ trong một năm, lượng người dùng thường xuyên của chatbot Gemini đã tăng hơn hai lần, đạt 900 triệu người. Con số này ngang ngửa số người đang dùng ChatGPT do OpenAI tự công bố, và gấp gần 30 lần con số ước tính lượng truy cập phiên bản web của chatbot Claude, vốn được Anthropic thiết kế hướng đến khách hàng doanh nghiệp.
"Nếu phải đặt cược vào người chiến thắng số 1 trong cuộc đua AI, tôi sẽ nói đó là Google," Gary Rivlin, cựu phóng viên của The New York Times, người từng viết hẳn cuốn sách về cuộc đua kiếm tiền từ AI của ngành công nghệ, đưa ra nhận định mới đây. Nhưng cũng chính Rivlin chia sẻ "nếu bạn hỏi tôi câu hỏi tương tự cách đây một năm rưỡi, câu trả lời sẽ không phải là Google".
Google muốn biến việc "dùng Gemini" dần giống như "dùng internet". Trong ảnh: Chatbot Gemini trên trình duyệt Google Chrome. Tác giả: Lưu Quý
Khởi đầu sớm nhưng chậm chân vì quá thận trọng
Chỉ hai năm trước, Google bị xem là đang "đuối" trong cuộc đua AI khi tung ra chatbot Gemini để chạy theo ChatGPT của OpenAI. Gemini khi ấy cung cấp những câu trả lời với rất nhiều lỗi, như khuyên có thể ăn đá để bổ sung dinh dưỡng hoặc cho keo vào pizza. Nhiều người đã nghĩ Google có thể mất vị thế thống trị internet về tay các startup AI mới như OpenAI.
Đó là nỗi đau cho Google, khi hơn 7 năm trước, CEO Google Sundar Pichai đã hứa chuẩn bị cho một thế giới lấy AI làm trung tâm trong cách con người sử dụng công nghệ và tiếp cận thông tin, nơi "trợ lý thông minh" sẽ thay thế "chính khái niệm về thiết bị". Ngay sau tuyên bố đó, 8 nhà nghiên cứu của Google đã tạo ra cấu trúc Transformer nổi tiếng - nền móng cho làn sóng chatbot AI hiện nay và là chữ ‘T’ trong tên gọi của ChatGPT.
Vậy mà Google đạt được gì từ thành tựu này? Doanh thu quảng cáo gây thất vọng. Hàng loạt tác giả của kiến trúc Transformer rời công ty. Google vào thời điểm đó chỉ có một chatbot nửa vời dành cho Gen Z gọi là trợ lý ảo, được dùng để đưa lời khuyên nấu ăn, kể bài học lịch sử, hẹn giờ và nhắc nhở.
Tới năm 2021, Google cũng có một mô hình ngôn ngữ mạnh gần ngang với OpenAI, gọi là LaMDA, nhưng kiểm soát nó rất chặt. Công chúng chỉ được trò chuyện với LaMDA khi được mời, và trong một bản demo, người dùng cho biết họ thậm chí chỉ được nói chuyện với LaMDA về... chó.
Vì quá thận trọng với rủi ro đạo đức và danh tiếng, Google chậm tung chatbot ra công chúng. Chỉ đến khi ChatGPT bùng nổ vào năm 2022 thì nội bộ Google mới giật mình bừng tỉnh, xem đó là "báo động đỏ" đe dọa cỗ máy kiếm tiền từ dịch vụ tìm kiếm của mình.
Đầu năm 2023, Sergey Brin, một trong những nhà đồng sáng lập nổi tiếng của Google, sau nhiều năm buông tay, đã phải quay trở lại công ty để trực tiếp xem xét chiến lược AI. Ban lãnh đạo Google tuyên bố với nhân viên rằng công ty phải vận hành "với tốc độ giống như một startup". Hàng trăm nhân sự được điều động khẩn cấp, làm việc ngày đêm trong bối cảnh Google sa thải 12.000 người đầu năm 2023.
Ngược dòng gian truân
Cả công ty ưu tiên nguồn lực cho dự án này. Nhóm cơ sở hạ tầng của Google điều chuyển những nhân viên hàng đầu của mình sang nhiệm vụ sắp xếp lại hệ thống để giải phóng thêm chỗ trên máy chủ, phục vụ việc tinh chỉnh và vận hành các mô hình AI. Họ gần như đã sử dụng tối đa điện năng tại một số trung tâm dữ liệu của công ty, thậm chí đối mặt nguy cơ thiết bị quá tải, phải nhanh chóng thiết kế các công cụ mới để giải quyết nhu cầu dùng điện tăng chưa từng thấy.
Cuộc đua khôi phục vị thế dẫn đầu AI của Google đã đẩy công ty vào nhiều khủng hoảng. Có lúc tinh thần nội bộ xuống rất thấp, đến mức nhân viên tụ tập ngoài hành lang và lo lắng công khai rằng Google có thể trở thành "Yahoo tiếp theo", một biểu tượng công nghệ từng thống trị rồi dần tụt lại phía sau.
Đã có rất nhiều lựa chọn "táo bạo và có trách nhiệm" trong toàn công ty, James Manyika, Phó Chủ tịch cấp cao tại Google, kể lại. Tuy vậy, ông cũng thừa nhận "không chắc lúc nào chúng tôi cũng làm đúng".
Với mốc thời gian 100 ngày tự áp đặt, điều tốt nhất Google có thể làm là phát hiện và khắc phục càng nhiều lỗi sai càng tốt. Trước đó, khi Bard (tiền thân của Gemini) được đưa ra thử nghiệm ở quy mô giới hạn, nó thậm chí đã cung cấp những thông tin sai căn bản về kính viễn vọng James Webb Space của NASA, đến nỗi bị báo chí réo tên và khiến cổ phiếu công ty mẹ của Google giảm 9%, tương đương khoảng 100 tỷ USD giá trị thị trường.
Gemini sau đó cũng bộc lộ nhiều vấn đề tương tự Bard khi được mở rộng cho lượng người dùng tăng vọt, lên 10 rồi lên 100 lần. Cả đội ngũ phát triển và đội ngũ đánh giá sản phẩm làm việc ngày đêm để hoàn thiện mô hình. Có những lúc, các nhóm đạo đức AI trong công ty cảnh báo cần chậm lại, nhưng lãnh đạo Google vẫn chọn ưu tiên tốc độ để không tụt hậu trước OpenAI và Microsoft.
Google sở hữu hệ sinh thái đa dạng để tích hợp AI. Thiết kế ảnh: Ngô Hà.
Phát huy lợi thế của hệ sinh thái Google khổng lồ
Ra mắt công chúng vào năm 2024, Gemini mất một thời gian để vượt qua sự soi xét của cả bên phản đối lẫn ủng hộ. Sau đó, Gemini dần dần đạt nhiều bước tiến: xử lý ngữ cảnh dài hơn (ví dụ phân tích hàng nghìn trang văn bản hoặc toàn bộ các tập phim truyền hình), chính xác hơn; bắt kịp OpenAI với tính năng tạo hình ảnh từ văn bản; vượt lên các đối thủ nhờ những tính năng như cho phép người dùng có những cuộc trò chuyện kéo dài với ứng dụng giống như họ đang nói chuyện với bạn bè hoặc chuyên gia trị liệu (Gemini Live); tạo podcast từ tài liệu (NotebookLM); tích hợp AI overview vào Search, Gmail, Maps, Android...
Khi Gemini đã đủ tốt, cỗ máy Google bắt đầu tích hợp nó vào hệ sinh thái sẵn có – từ máy tìm kiếm Google Search, hệ điều hành điện thoại di động Android, trình duyệt Chrome, thư điện tử Gmail, bản đồ Google Maps, bộ công cụ văn phòng trực tuyến Google Workspace, đến nền tảng chia sẻ video YouTube... - và phát huy lợi thế khổng lồ từ đó, khiến việc "dùng Gemini" dần giống như "dùng internet".
Google đã dành hai thập kỷ để biến những phản xạ quen thuộc của người dùng thành một mô hình kinh doanh hái ra tiền, và họ đang làm điều đó với Gemini. Google muốn việc "hỏi chatbot" phải trở thành một hành động mặc định, đến mức bạn chẳng buồn nghĩ xem mình đang dùng ứng dụng nào - giống hệt cách họ từng làm với công cụ tìm kiếm, quảng cáo, và những tab trình duyệt mà bạn cứ mở suốt ngày như một chỗ dựa tinh thần.
Các đối thủ như OpenAI có thể tạo ra AI tốt, nhưng vẫn phải mất nhiều năm đương đầu với thực tế rằng phần lớn người dùng đã sống trong thế giới Google, và người dùng thì vừa bận rộn lại vừa ngại thay đổi. Trong những hoàn cảnh phù hợp, một AI "đủ tốt" có thể lan tỏa nhanh hơn nhiều so với thứ "tốt nhất".
Không ai kiếm tiền từ AI giỏi như Google
Trong khi OpenAI và Anthropic phải thiêu đốt tiền bạc trong cuộc chạy đua phát triển AI, Google lại dùng AI để hái ra tiền. Doanh thu quảng cáo quý gần nhất của Google tăng 16%, đạt 77 tỷ USD, nhờ công nghệ AI giúp các nhà tiếp thị thu thập thông tin sâu hơn về sở thích của người dùng.
Cũng tại hội nghị I/O, Google đã quảng bá cách họ sẽ sử dụng AI để tăng doanh số cho các nhà bán lẻ trực tuyến, trong đó có một kiểu "giỏ hàng" mới, tự động hiển thị chương trình khuyến mãi cho từng người mua.
Google có lợi thế lớn khi dùng AI để khai thác thị trường du lịch. Gemini hiện là chatbot duy nhất được kết nối trực tiếp với Google Flights và Google Hotels, cho phép tra cứu vé máy bay và khách sạn theo thời gian thực. Nhờ đó, Gemini hoạt động như một "đại lý hỗ trợ du lịch" hiệu quả hơn nhiều đối thủ.
Với hơn 4 tỷ người, tức gần một nửa dân số thế giới, dùng công cụ tìm kiếm Google Search mỗi ngày, Gemini quả thực có một mảnh đất vô cùng màu mỡ để thi triển các tính năng.
Khoảng 95% smartphone trên toàn cầu sẽ có bóng dáng của Gemini. Trong ảnh: Giao diện Google Gemini trên website cho smartphone. Tác giả: Bảo Lâm
Chẳng bao lâu nữa, Gemini sẽ còn ‘cắm rễ’ vào gần như mọi chiếc điện thoại trên đời. Đầu năm nay, Google đã đạt được thỏa thuận đưa Gemini thành công nghệ AI nền tảng cho các phiên bản trợ lý giọng nói Siri của Apple. Cùng với việc trước đó Google đã đưa Gemini thành mặc định trong hệ điều hành Android, điều này đồng nghĩa với việc khoảng 95% smartphone trên toàn cầu sẽ có bóng dáng của Gemini.
Toàn bộ lịch sử kinh doanh của Google là một ví dụ điển hình về những gì xảy ra khi một ứng dụng trở thành một lớp công nghệ đi theo người dùng ở mọi nơi và "đủ tốt" để giữ chân họ. Và quan trọng hơn, Google có đủ tiền để chờ người dùng hình thành thói quen.
Nếu cuộc cạnh tranh kết thúc với việc AI trở thành giao diện tiêu chuẩn cho việc tìm kiếm thông tin và thao tác thì công ty kiểm soát các bề mặt giao diện đó sẽ nắm quyền đặt ra ‘mức phí’. Và Google đã có 25 năm hoàn thiện nghệ thuật thu phí này.
Quang Duy tổng hợp
(Theo Quarts, The New York Times, Wired )