Nền tảng dạy những người không chuyên sử dụng học máy

Học máy (machine learning) dùng để tìm ra các khuôn mẫu trong dữ liệu mà con người không nhận thấy. Nó đang được dùng để cung cấp thông tin cho nhiều quyết định lớn nhỏ - từ phát triển vaccine COVID-19 đến đề xuất phim trên Netflix.

Nghiên cứu mới đoạt giải thưởng “bài nghiên cứu tốt nhất” tại hội nghị quốc tế thường niên về yếu tố con người trong hệ thống máy tính ACM CHI tổ chức vào tháng 5 vừa qua của Trường cao đẳng Máy tính và Khoa học Thông tin thuộc Đại học Cornell đã tìm cách hỗ trợ những người người không chuyên sử dụng các thuật toán học máy một cách hiệu quả, năng suất và đúng đắn để giúp các ngành công nghiệp không thuộc lĩnh vực điện toán cũng có thể khai thác sức mạnh của AI.

“Chúng tôi không biết nhiều về cách những không chuyên về học máy học các công cụ thuật toán như thế nào. Lý do là nhiều người cường điệu rằng học máy chỉ dành cho những người có chuyên môn”, Swati Mishra, nghiên cứu sinh tiến sĩ về khoa học thông tin và là tác giả chính của nghiên cứu đoạt giải “Designing Interactive Transfer Learning Tools for ML Non-Experts” chia sẻ. Khi học máy đi vào những lĩnh vực và ngành công nghiệp truyền thống không liên quan đến điện toán thì nhu cầu nghiên cứu và có những công cụ hiệu quả, dễ tiếp cận để người dùng mới có thể tận dụng sức mạnh của AI sẽ tăng đến mức chưa từng có, Mishra nói.

Các nghiên cứu trước đó về các hệ thống tương tác học máy chủ yếu tập trung vào việc hiểu người dùng và những thách thức mà họ phải đối mặt khi điều hướng các công cụ. Nghiên cứu mới nhất của Mishra đã đặt chân vào một địa hạt mới bằng cách làm điều ngược lại: Làm sao để thiết kế được một hệ thống tốt hơn giúp những người dùng chỉ có hiểu biết hạn chế về thuật toán nhưng lại nhiều chuyên môn trong các lĩnh vực khác nhau có thể học tập và tích hợp những mô hình đã có vào công việc của họ. Mishra đã phát triển một nền tảng tương tác học máy của riêng mình.

Mishra đã sử dụng một quá trình phức tạp gọi là “học chuyển giao” (transfer learning) làm điểm khởi đầu để những người không chuyên làm quen với học máy. Đây là một kỹ thuật học máy cao cấp thường dành riêng cho chuyên gia, trong đó người dùng sẽ tinh chỉnh và tái sử dụng những mô hình học máy hiện có theo các mục đích khác nhau để phục vụ cho những tác vụ mới.

Kỹ thuật này giúp người dùng không phải xây dựng mô hình từ đầu vốn đòi hỏi nhiều dữ liệu đào tạo. Ví dụ, nó cho phép người dùng có thể tái sử dụng một mô hình đã được đào tạo để nhận diện hình ảnh chó thành một mô hình nhận diện hình ảnh mèo, hoặc thậm chí nếu đưa chuyên môn phù hợp vào trong đó, nó có thể biến thành mô hình nhận diện ung thư da. PGS. Jeff Rzeszotarski ở Khoa khoa học thông tin và là đồng tác giả của bài báo cho biết: “Bằng cách tập trung đưa các mô hình hiện có vào các tác vụ mới, nền tảng của Swati không chỉ giúp những người mới dùng được học máy để giải quyết những vấn đề phức tạp mà còn tận dụng được sự phát triển liên tục của các chuyên gia học máy.”

Mishra và Rzeszotarski nhận thấy rằng người những người không chuyên tham gia có thể sử dụng thành công việc học chuyển giao và thay đổi các mô hình hiện có cho mục đích riêng của mình. Nhưng họ cũng phát triển rằng những nhận thức không xác đáng về trí thông minh của máy móc thường làm chậm tiến độ học của những người không chuyên này.

Máy móc không học như con người, Mishra nói. “Chúng ta đã quen với phong cách học tập như con người và về mặt trực quan, chúng ta có xu hướng sử dụng các chiến lược quen thuộc với mình. Nếu các công cụ không truyền đạt rõ ràng sự khác biệt này, máy móc có thể sẽ không bao giờ thực sự học được. Với tư cách là nhà nghiên cứu và nhà thiết kế nền tảng, chúng tôi phải tìm cách giảm thiểu góc nhìn nhận thức của người dùng về việc rốt cuộc học máy là gì. Bất kỳ công cụ tương tác nào cũng phải giúp người ta kiểm soát được kỳ vọng của mình”

Trang Linh lược dịch 

Nguồn: https://news.cornell.edu/stories/2021/07/platform-teaches-nonexperts-use-machine-learning

https://dl.acm.org/doi/10.1145/3411764.3445096

Tác giả

(Visited 3 times, 1 visits today)