SoapBox Lab xây dựng công nghệ nhận dạng giọng nói cho trẻ em

TẠ XUÂN QUAN• 22/01/2018 16:38

(QNO) - Công ty khởi nghiệp SoapBox Lab của Ireland đang thực hiện sứ mệnh tạo ra "công nghệ ngôn ngữ chính xác và truy cập gần gũi nhất cho trẻ em trên thế giới".

Minh hoạ công nghệ nhận diện giọng nói cho trẻ em

Minh họa công nghệ nhận diện giọng nói cho trẻ em.

Đây là công nghệ dự định cung cấp cho các nhà phát triển phần cứng và phần mềm của bên thứ ba. Các ứng dụng giáo dục mở rộng hỗ trợ đọc và phát triển ngôn ngữ, kiểm soát tiếng nói của trẻ em cho các thiết bị IoT (internet vạn vật) trong nhà, đồ chơi thông minh và trải nghiệm AR/VR.

Được thành lập vào năm 2013 bởi tiến sĩ Patricia Scanlon, một nhà nghiên cứu của Bell Labs với gần 20 năm kinh nghiệm trong lĩnh vực công nghệ nhận dạng giọng nói, công ty trẻ này dựa trên giả thiết rằng công nghệ nhận dạng giọng nói được xây dựng cho người lớn, gần đây đã được tìm thấy trong các thiết bị như Amazon Echo hoặc Google Home, không hoạt động tốt như nó có thể đối với trẻ em.

Chuyên trang Techcrunch giải thích việc không chính xác xảy ra vì trẻ em có giọng nói cao hơn người lớn và các mẫu giọng khác nhau. Trẻ em cũng không có xu hướng thích nghi ngôn ngữ của mình cho phù hợp với máy móc, cái gì đó chúng ta thực hiện một cách có ý thức hoặc vô thức để nâng cao tiện ích của các giao diện người dùng cho phép thoại và cái gọi là trợ lý thông minh.

Scanlon giải thích rằng khi bà và nhóm SoapBox Labs bắt đầu làm việc về vấn đề này vào năm 2013, họ đã phải bỏ qua nhiều điều họ đã biết về cách xây dựng công nghệ thoại. Sau một giai đoạn nghiên cứu sâu rộng, rõ ràng là "hành vi nói của trẻ rất khác với người lớn", đặc biệt là trẻ nhỏ càng nhỏ càng khác biệt. Công nghệ nhận dạng giọng nói phát triển bằng cách sử dụng dữ liệu giọng nói dành cho người lớn mà các mô hình hành vi của người lớn dẫn đến hiệu suất kém khi được sử dụng bởi trẻ nhỏ.

Vì vậy, SoapBox Labs đã tạo ra tập dữ liệu độc đáo của về trẻ em (bao gồm hàng ngàn giờ dữ liệu về lời nói của trẻ) và kết hợp với sự hiểu biết của nhóm về giọng nói và hành vi của trẻ. Các nền tảng kết quả được cho là sử dụng các kỹ thuật học tập sâu để cung cấp cho các mô hình độc quyền và các thuật toán ghi điểm, và cuối cùng cung cấp công nghệ lời nói tốt hơn cho trẻ em.

SoapBox Labs đã phát hành phiên bản API nhận dạng giọng nói cho trẻ em bằng tiếng Anh của mình cho các bên thứ ba sử dụng, thông báo rằng một số đối tác sẽ được cung cấp vào đầu tháng tới.

SoapBox cho biết về khoản tài trợ thêm 2,1 triệu euro, nguồn vốn mà họ dự định sử dụng để bổ sung nhiều ngôn ngữ vào nền tảng nhận dạng tiếng nói. Như vậy tổng kinh phí cho SoapBox Lab đã vượt hơn 3 triệu euro như mong đợi.

TẠ XUÂN QUAN