PGS.TS Thái Thanh Trúc, giảng viên Đại học Y dược thành phố, đã đề cập đến những khó khăn trong việc sử dụng dữ liệu bệnh nhân để áp dụng các mô hình trí tuệ nhân tạo trong việc chẩn đoán bệnh, tại hội thảo "Trí tuệ nhân tạo phục vụ chăm sóc sức khỏe" được tổ chức vào ngày 29/9 bởi Trung tâm Thông tin và Thống kê Khoa học Công nghệ (Sở Khoa học và Công nghệ TP HCM).
Khi tiến hành đề tài nghiên cứu về ứng dụng trí tuệ nhân tạo (AI) trong việc chẩn đoán bệnh viêm ruột thừa cấp, ông đã chia sẻ rằng nhóm nghiên cứu đã sử dụng dữ liệu từ 4.200 bệnh nhân được điều trị tại bệnh viện Nhân dân Gia Định. Các bệnh nhân này đã được phẫu thuật cắt ruột thừa trong khoảng thời gian từ năm 2016 đến năm 2020. Sử dụng các thông tin từ dữ liệu này, nhóm nghiên cứu đã xây dựng một mô hình AI để tính toán khả năng biến chứng của bệnh theo tỷ lệ phần trăm. Mô hình này sẽ giúp các bác sĩ có thể đưa ra quyết định liệu nên tiến hành phẫu thuật cắt bỏ ruột thừa hay áp dụng phương pháp điều trị bảo tồn ruột thừa.
Tuy nhiên, PGS Trúc cho biết việc thu thập và xử lý dữ liệu bệnh nhân là một thách thức và tốn nhiều thời gian nhất. Nhóm nghiên cứu chỉ có thể sử dụng dữ liệu của hơn 3.000 người trong tổng số hơn 4.200 ca bệnh để đảm bảo chất lượng và tiếp tục xử lý dữ liệu để có thông tin đầy đủ về hơn 2.000 bệnh nhân. Do đó, một số lượng lớn dữ liệu bệnh nhân đã bị loại bỏ. PGS Trúc nói rằng không ai biết được liệu những dữ liệu bị loại ra có chứa thông tin có giá trị hay không, bởi vì chúng có thể là các trường hợp bệnh nặng có thể ảnh hưởng đến độ chính xác của mô hình. Tuy vậy, nhóm nghiên cứu vẫn đang sử dụng các mô hình toán học để khắc phục những khuyết điểm này và tận dụng một phần của dữ liệu bị loại bỏ.
PGS.TS Thái Thanh Trúc đã phát triển một trang web sử dụng trí tuệ nhân tạo để hỗ trợ chẩn đoán bệnh viêm ruột thừa cấp. Hình ảnh được cung cấp bởi Hà An.
The reason for the exclusion of data sources, according to Associate Professor Truc, is due to the lack of complete or standardized information in the medical records. As evidence, he mentioned that two doctors may have different approaches when dealing with the same illness, where experienced doctors may only ask a few questions, while newly graduated doctors tend to ask more. This creates inconsistent information about the patient's condition. Additionally, the use of regional language also leads to different information. Consequently, this results in the input of different information and the use of different terminology in medical records, leading to unstandardized data. "This will pose challenges in inputting and managing patient data," said Associate Professor Truc, adding that unstandardized data will be difficult to exploit as AI models require clean and complete input data to ensure accuracy.
The Director of the Data Science Laboratory at the Institute for Advanced Study in Mathematics (VIASM), Professor Ho Tu Bao, shares the same viewpoint that handling patient information in medical records is highly complex due to two fundamental types of data. These include clinical information written by doctors and nurses, as well as images captured through radiography and endoscopy, which are in numerical format.
Ông Bảo nhấn mạnh rằng một trong những thách thức trong việc xử lý thông tin y tế là sự không đồng nhất trong các thông tin do con người tạo ra, liên quan đến quá trình khám chữa bệnh và kiến thức y học chuyên ngành. Ông cho biết rằng xử lý ngôn ngữ tự nhiên đã khó, nhưng việc làm điều này với ngôn ngữ y học lại còn khó hơn nữa, vì nó chứa đựng nhiều kiến thức chuyên môn tích luỹ từ hàng nghìn năm phát triển của ngành y. Vì vậy, ông đề xuất cần chuẩn hóa ngôn ngữ trong lĩnh vực y tế, nhằm đạt được sự thống nhất về thuật ngữ chuyên môn và cách sử dụng từ viết tắt. Để đảm bảo tính chính xác hơn, các dữ liệu trong dạng số và văn bản sau khi được chuẩn hóa sẽ được tính toán bằng thuật toán trí tuệ nhân tạo.
Theo GS Bảo, việc chuẩn hóa dữ liệu bệnh nhân là cơ sở để xây dựng đề án hồ sơ điện tử có sử dụng dữ liệu và mô hình trí tuệ nhân tạo nhằm giúp cơ quan quản lý có cái nhìn tổng quan về tình hình sức khỏe của người dân toàn quốc hoặc từng bệnh viện. Từ thông tin thu thập được, chính phủ sẽ có thể đưa ra các chính sách liên quan đến chăm sóc sức khỏe cho người dân. Tuy nhiên, ông cũng nhấn mạnh rằng việc này là một quá trình dài, và cần có sự tiến triển theo từng năm.
Theo ông Nguyễn Thanh Vũ, Viện trưởng Viện nghiên cứu y sinh, trong quá trình thăm khám quá nhiều bệnh nhân, áp lực công việc có thể khiến cho bác sĩ không thể nhớ được thông tin đầy đủ. Ông cho biết rằng, Viện đang xây dựng chuẩn dữ liệu bệnh theo tiêu chuẩn của Bộ Y tế về các thuật ngữ chuyên ngành. Bác sĩ Vũ hy vọng có thể hợp tác cung cấp nguồn dữ liệu cho các tổ chức nghiên cứu nhằm phát triển các mô hình Trí tuệ nhân tạo (AI) hỗ trợ bác sĩ trong việc chẩn đoán các bệnh thông thường.
Hà An là một cái tên được đặt cho một người hoặc một địa điểm cụ thể.