Google vừa âm thầm ra mắt một ứng dụng ghi âm mới trên iOS có tên Google AI Edge Eloquent , trực tiếp cạnh tranh với các ứng dụng phổ biến trong mảng này như Wispr Flow, SuperWhisper hay Willow.
Ứng dụng hoàn toàn miễn phí. Sau khi tải về và cài đặt các mô hình nhận dạng giọng nói dựa trên Gemma, người dùng có thể bắt đầu đọc để ghi âm ngay trên điện thoại. Trong lúc nói, màn hình sẽ hiển thị nội dung phiên âm theo thời gian thực. Khi người dùng dừng lại, ứng dụng sẽ tự động lọc bỏ các từ đệm vô nghĩa như "ừm", "à", "ờ" rồi trau chuốt lại đoạn văn cho gọn gàng, rõ ràng hơn.
Bên dưới phần văn bản hiển thị có thêm các tùy chọn để chuyển đổi nội dung theo nhu cầu, gồm: rút gọn ý chính, viết theo văn phong trang trọng, rút ngắn hoặc mở rộng độ dài. Người dùng cũng có thể tắt chế độ đám mây để chạy hoàn toàn trên thiết bị, không cần kết nối internet. Khi bật chế độ đám mây, ứng dụng sẽ dùng các mô hình Gemini trên máy chủ để làm sạch văn bản.
Một tính năng đáng chú ý là khả năng nhập danh sách từ khóa, tên riêng hoặc thuật ngữ chuyên ngành từ tài khoản Gmail của người dùng, giúp ứng dụng nhận dạng chính xác hơn các từ đặc thù. Người dùng cũng có thể tự thêm từ vào danh sách này theo ý muốn.
Ngoài ra, Google AI Edge Eloquent còn lưu lại toàn bộ lịch sử các phiên làm việc và hỗ trợ tìm kiếm trong đó. Ứng dụng có thể cho biết số từ đã nói trong phiên gần nhất, tốc độ đọc tính theo số từ mỗi phút, và tổng số từ đã ghi lại từ trước đến nay.
Hiện tại ứng dụng mới chỉ có trên iOS, nhưng phần mô tả trên App Store đã đề cập đến phiên bản Android sắp tới. Theo đó, trên Android, ứng dụng sẽ có thể được đặt làm bàn phím mặc định để hoạt động trên toàn hệ thống, đồng thời hỗ trợ nút nổi tiện lợi, tương tự tính năng mà Wispr Flow đang có, giúp người dùng kích hoạt tính năng ghi âm từ bất kỳ màn hình nào.
Sự xuất hiện của Google AI Edge Eloquent cho thấy các ứng dụng ghi âm bằng AI đang ngày càng được người dùng quan tâm, khi các mô hình nhận dạng giọng nói liên tục được cải thiện.