Thuật toán AI cải thiện độ chính xác và chi phí chẩn đoán hình ảnh y tế
Chẩn đoán hình ảnh y tế, một phần chính của hệ thống chăm sóc sức khỏe hiện đại, là một trong những công nghệ đã được cải thiện đáng kể nhờ trí tuệ nhân tạo (AI). Theo đó, chẩn đoán hình ảnh y tế dựa trên thuật toán AI đòi hỏi một lượng lớn chú thích làm tín hiệu giám sát để đào tạo mô hình. Các bác sĩ phải chuẩn bị báo cáo chẩn đoán hình ảnh cho bệnh nhân để có được các nhãn chính xác này cho thuật toán. Sau đó, họ phải dựa vào đội ngũ chú thích để trích xuất và xác nhận nhãn có cấu trúc từ các báo cáo bằng các quy tắc do con người xác định và các công cụ xử lý ngôn ngữ tự nhiên (NLP) hiện có. Điều này có nghĩa là độ chính xác của nhãn được trích xuất phụ thuộc rất nhiều vào công việc của con người và các công cụ NLP, và toàn bộ phương pháp này vừa tốn nhiều công sức vừa mất thời gian.
Phương pháp REEFERS
Hiện nay, một nhóm các kỹ sư tại Đại học Hồng Kông (HKU) đã phát triển một phương pháp mới có tên là “REEFERS” (Xem lại các báo cáo dạng văn bản tự do để giám sát). Phương pháp mới này có thể cắt giảm 90% chi phí của con người bằng cách cho phép tự động thu thập tín hiệu giám sát từ hàng trăm nghìn báo cáo chẩn đoán hình ảnh. Điều này giúp dự đoán chính xác hơn. Nghiên cứu mới đã được công bố trên Nature Machine Intelligence. Với tiêu đề “Học biểu diễn ảnh chụp X-quang tổng quát thông qua giám sát chéo giữa hình ảnh và báo cáo chẩn đoán hình ảnh dạng văn bản tự do”. Phương pháp REEFERS đưa chúng ta đến gần hơn với việc đạt được AI y tế tổng quát. Giáo sư Yu Yizhou là trưởng nhóm kỹ thuật tại Khoa Khoa học Máy tính của HKU. Giáo sư Yu cho biết: “Chúng tôi tin rằng các câu lập luận logic trừu tượng và phức tạp trong báo cáo chẩn đoán hình ảnh cung cấp đủ thông tin để học các đặc điểm trực quan có thể dễ dàng chuyển giao. Với việc đào tạo thích hợp, REEFERS học trực tiếp biểu diễn ảnh chụp X-quang từ các báo cáo dạng văn bản tự do mà không cần sự tham gia của con người trong dán nhãn”.
Đào tạo hệ thống
Để đào tạo REEFERS, nhóm đã sử dụng một cơ sở dữ liệu công khai với 370.000 hình ảnh X-quang, cũng như các báo cáo chẩn đoán hình ảnh liên quan. Các nhà nghiên cứu đã xây dựng một mô hình nhận dạng ảnh chụp X-quang chỉ với 100 ảnh chụp X-quang và đạt được độ chính xác 83% trong các dự đoán. Sau đó, mô hình có thể đạt tỷ lệ chính xác 88,2% khi số lượng tăng lên 1.000. Khi sử dụng 10.000 ảnh chụp X-quang, độ chính xác lại tăng lên 90,1%. REEFERS có thể đạt được mục tiêu bằng cách hoàn thành hai nhiệm vụ liên quan đến báo cáo. Nhiệm vụ đầu tiên bao gồm việc dịch ảnh chụp X-quang thành báo cáo văn bản bằng cách mã hóa ảnh chụp X-quang thành một biểu diễn trung gian. Sau đó, biểu diễn này được sử dụng để dự đoán báo cáo văn bản thông qua một mạng giải mã. Để đo lường sự tương đồng giữa báo cáo văn bản dự đoán và thực tế, một hàm chi phí được xác định. Nhiệm vụ thứ hai liên quan đến REEFERS đầu tiên mã hóa cả ảnh chụp X-quang và báo cáo văn bản tự do thành cùng một không gian ngữ nghĩa. Trong không gian này, các biểu diễn của mỗi báo cáo và ảnh chụp X-quang liên quan được căn chỉnh thông qua học tập tương phản. Tiến sĩ Zhou Hong-Yu là tác giả đầu tiên của bài báo. Ông cho biết: “So với các phương pháp thông thường phụ thuộc nhiều vào chú thích của con người, REFERS có khả năng tiếp nhận sự giám sát từ từng từ trong báo cáo chẩn đoán hình ảnh. Chúng tôi có thể giảm đáng kể 90% lượng dữ liệu chú thích và chi phí xây dựng trí tuệ nhân tạo y tế. Đây là một bước tiến quan trọng hướng tới việc hiện thực hóa trí tuệ nhân tạo y tế tổng quát”.
|