“Bảng tuần hoàn máy học” có thể thúc đẩy khám phá AI
Một công trình đột phá từ Viện Công nghệ Massachusetts (MIT) đang tái định hình cách các nhà khoa học phát triển trí tuệ nhân tạo (AI) dựa trên lăng kính toán học đơn giản nhưng đầy uy lực.
![]() |
Bảng tuần hoàn máy học I-Con do nhóm nghiên cứu MIT phát triển, phân loại các thuật toán AI dựa trên biểu diễn dữ liệu học được (trục dọc) và tín hiệu giám sát (trục ngang). Ảnh: MIT News |
Gần 150 năm trước, bảng tuần hoàn của Mendeleev mang trật tự đến cho hóa học. Ngày nay, các nhà nghiên cứu tại MIT áp dụng cách tiếp cận tương tự cho AI, xây dựng “bảng tuần hoàn máy học” hứa hẹn làm thay đổi cách chúng ta phát triển và hiểu về AI trong thập niên tới.
Khám phá tình cờ
Khi cô Shaden Alshammari, nghiên cứu sinh tại MIT bắt đầu tìm hiểu kỹ thuật phân cụm (phương pháp phân loại hình ảnh bằng cách nhóm những hình tương tự lại gần nhau), cô không hề có ý định tạo ra công cụ có thể định hình lại toàn bộ lĩnh vực học máy.
Ban đầu, Alshammari chỉ nhận thấy điều thú vị: thuật toán phân cụm mà cô nghiên cứu có nhiều điểm chung với thuật toán học máy cổ điển khác gọi là học đối lập (contrastive learning). Khi đi sâu vào phần toán học, cô bất ngờ phát hiện cả hai thuật toán, vốn được xem là tách biệt đều có thể diễn giải bằng cùng một phương trình cơ bản.
“Chúng tôi gần như tình cờ tìm ra phương trình thống nhất này. Khi Shaden phát hiện ra nó kết nối hai phương pháp, chúng tôi bắt đầu nghĩ ra các phương pháp mới để đưa vào khung này. Gần như tất cả các phương pháp chúng tôi thử đều có thể được thêm vào”, ông Mark Hamilton, nghiên cứu sinh MIT và quản lý kỹ thuật cấp cao tại Microsoft, đồng thời là tác giả chính của nghiên cứu, chia sẻ trên MIT News.
Từ phát hiện ấy, nhóm phát triển khung lý thuyết mới mang tên Information Contrastive Learning (I-Con) cho thấy nhiều thuật toán, từ phân loại thư rác đơn giản đến học sâu phức tạp trong các mô hình ngôn ngữ lớn đều có thể phân tích dưới lăng kính phương trình thống nhất.
Phương trình thống nhất này mô tả cách các thuật toán tìm kiếm mối liên hệ giữa các điểm dữ liệu thực, rồi tái tạo những kết nối đó trong cấu trúc nội bộ. Mục tiêu chung của các thuật toán là giảm thiểu sự khác biệt giữa mạng kết nối mà chúng học được và mạng kết nối thực trong dữ liệu huấn luyện.
Nhóm nghiên cứu sắp xếp I-Con thành dạng “bảng tuần hoàn” để phân loại các thuật toán dựa trên hai tiêu chí chính: cách mỗi thuật toán thiết lập mối liên hệ giữa các điểm dữ liệu trong thế giới thực và phương pháp toán học chủ yếu mà thuật toán đó sử dụng để mô phỏng những mối liên hệ này.
Từ lý thuyết đến đột phá thực tế
Ngay khi bảng tuần hoàn I-Con được định hình, các nhà nghiên cứu bắt đầu nhận ra những khoảng trống, các vị trí mà các thuật toán có thể tồn tại nhưng chưa được phát minh. Tình huống này gợi nhớ bảng tuần hoàn hóa học của Mendeleev, với những ô trống sau đó được lấp đầy bằng các nguyên tố mới. Nhận thấy tiềm năng đó, nhóm nghiên cứu nhanh chóng lấp đầy một khoảng trống.
Họ kết hợp các yếu tố từ kỹ thuật học đối lập (contrastive learning) và áp dụng vào phân cụm hình ảnh, tạo ra thuật toán mới vượt trội hơn 8% so với các phương pháp tiên tiến hiện có, theo ScienceDaily. Đây không phải là bước tiến nhỏ trong học máy. Trong một lĩnh vực mà những cải thiện thường chỉ tính bằng từng phần trăm, việc nâng cao 8% hiệu suất phân loại đánh dấu thành tựu đáng kể.
Nhóm nghiên cứu cũng chứng minh tính ứng dụng rộng rãi của I-Con bằng cách chuyển giao thành công kỹ thuật khử thiên kiến dữ liệu từ học đối lập sang các thuật toán phân cụm, giúp nâng cao độ chính xác, theo MIT News.
Một trong những thế mạnh lớn nhất của bảng tuần hoàn này là tính linh hoạt. Các nhà nghiên cứu có thể thêm hàng và cột mới để biểu diễn những loại kết nối dữ liệu bổ sung, mở rộng phạm vi ứng dụng của khung theo thời gian, tương tự như cách bảng tuần hoàn hóa học không ngừng lớn lên cùng những khám phá mới. “Đây không chỉ là phép ẩn dụ. Chúng tôi đang bắt đầu nhìn nhận học máy như một hệ thống có cấu trúc, một không gian mà chúng ta có thể khám phá thay vì chỉ đoán mò”, nghiên cứu sinh Alshammari nhấn mạnh với MIT News.
I-Con đóng vai trò như công cụ dẫn đường, giúp các nhà khoa học vượt ra ngoài tư duy quen thuộc, khuyến khích họ kết hợp ý tưởng theo những cách mà trước đây có thể chưa từng nghĩ tới. “Chúng tôi đã chứng minh rằng chỉ với một phương trình đơn giản và hiệu quả này, bắt nguồn từ khoa học thông tin, có thể tạo ra những thuật toán phong phú trải dài suốt 100 năm nghiên cứu học máy. Điều này mở ra nhiều con đường khám phá mới”, ông Hamilton nói với MIT News.
Khung I-Con không chỉ là hệ thống phân loại, nó đại diện cho sự chuyển đổi trong phương pháp nghiên cứu AI. Trước đây, việc phát triển thuật toán mới thường dựa vào trực giác và sự may mắn. Giờ đây, các nhà nghiên cứu có thể khám phá không gian thuật toán một cách có hệ thống, tương tự như cách các nhà hóa học sử dụng bảng tuần hoàn nguyên tố để dự đoán nguyên tố mới trước khi chúng được phát hiện.
“Có lẽ thách thức lớn nhất với một nhà nghiên cứu học máy hiện nay là lượng bài báo mới dường như vô tận mỗi năm. Trong bối cảnh đó, những công trình thống nhất và kết nối các thuật toán hiện có rất quý giá nhưng cực kỳ hiếm. I-Con là ví dụ xuất sắc cho cách tiếp cận thống nhất này và hy vọng sẽ truyền cảm hứng cho những lĩnh vực khác của học máy”, Giáo sư Yair Weiss tại Đại học Hebrew ở Jerusalem nhận định trên MIT News.
TRẦN ĐẮC LUÂN
Nguồn: Báo Đà Nẵng