GIỚI THIỆU — Y học dựa trên bằng chứng (EBM) là dịch vụ chăm sóc bệnh nhân sử dụng bằng chứng nghiên cứu tốt nhất hiện có để hướng dẫn việc ra quyết định lâm sàng ( hình 1 ) [ 1,2 ]. Giá trị của EBM được nâng cao dựa trên những cân nhắc sau:
●Khối lượng bằng chứng sẵn có để hướng dẫn các quyết định lâm sàng tiếp tục tăng với tốc độ nhanh chóng ( hình 2 ).
●Những cải tiến trong thiết kế nghiên cứu, đo lường lâm sàng và phương pháp phân tích dữ liệu đã giúp hiểu rõ hơn về cách tạo ra nghiên cứu lâm sàng hợp lệ.
●Bất chấp những tiến bộ trong phương pháp nghiên cứu, nhiều kết quả nghiên cứu được công bố là sai hoặc đưa ra kết luận sai lệch [ 3 ].
●Nhiều bác sĩ lâm sàng, ngay cả những người có uy tín tốt, không hành nghề y theo bằng chứng nghiên cứu tốt nhất hiện nay.
Các yếu tố cơ bản của EBM được xem xét ở đây. Chúng bao gồm [ 1 ]:
●Xây dựng một câu hỏi lâm sàng
●Tìm kiếm bằng chứng tốt nhất hiện có
●Đánh giá tính giá trị của bằng chứng (bao gồm giá trị bên trong và bên ngoài)
●Áp dụng bằng chứng vào thực tế, kết hợp với chuyên môn lâm sàng và sở thích của bệnh nhân
Trọng tâm là áp dụng các kết quả nghiên cứu liên quan đến bệnh nhân và kết quả lâm sàng, chẳng hạn như tử vong, bệnh tật, triệu chứng và mất chức năng. Các loại bằng chứng khác, chẳng hạn như những bằng chứng thu được từ kinh nghiệm cá nhân và nghiên cứu trong phòng thí nghiệm về cơ chế bệnh sinh, cũng hữu ích trong việc chăm sóc bệnh nhân nhưng thường không được đưa vào danh mục "y học dựa trên bằng chứng". EBM nhằm mục đích bổ sung chứ không phải thay thế phán đoán lâm sàng trong việc điều chỉnh dịch vụ chăm sóc cho từng bệnh nhân. Tương tự như vậy, EBM và việc cung cấp dịch vụ chăm sóc hiệu quả và nhạy cảm về mặt văn hóa, xã hội và cá nhân là bổ sung chứ không mâu thuẫn ( hình 1 ).
XÂY DỰNG MỘT CÂU HỎI LÂM SÀNG — Các câu hỏi lâm sàng thường phức tạp, nhưng thông thường sẽ là khôn ngoan nếu bạn tập trung hơn bằng cách trả lời các câu hỏi đơn giản hơn ( bảng 1 ). Câu hỏi phải được xác định rõ ràng trước khi tìm kiếm câu trả lời [ 4 ].
Việc tìm kiếm câu trả lời tốt nhất cho các câu hỏi lâm sàng bắt đầu bằng việc xây dựng câu hỏi chặt chẽ và rõ ràng [ 4 ]. Ví dụ, câu hỏi "cách điều trị tốt nhất cho bệnh tiểu đường loại 2 là gì?" là quá chung chung và rộng để được trả lời tốt. Để đánh giá hiệu quả của một biện pháp can thiệp, cần xem xét bốn câu hỏi (thường được gọi là "PICO") ( bảng 2 ):
●Dân số bệnh nhân có liên quan là gì ?
●Sự can thiệp nào đang được xem xét?
●Sự can thiệp so sánh hoặc dân số bệnh nhân là gì ?
●Kết quả nào được quan tâm?
Ví dụ, một câu hỏi liên quan có thể trả lời có thể là: "Trong số những người trưởng thành béo phì mắc bệnh tiểu đường loại 2, metformin có hiệu quả hơn thuốc sulfonylurea trong việc ngăn ngừa tử vong không?"
Cách tiếp cận tương tự đối với các câu hỏi lâm sàng liên quan đến chẩn đoán hoặc tiên lượng ( bảng 2 ).
Dân số bệnh nhân - Mục tiêu cuối cùng của EBM là thông báo các quyết định lâm sàng liên quan đến từng bệnh nhân. Do đó, lý tưởng nhất là người ta sẽ tìm kiếm câu trả lời từ các nghiên cứu tuyển chọn những đối tượng nghiên cứu rất giống với bệnh nhân của mình. Nếu đối tượng mục tiêu được xác định quá rộng, kết quả nghiên cứu có thể không áp dụng được cho những bệnh nhân có đặc điểm khác biệt đáng kể so với đối tượng nghiên cứu điển hình.
Tuy nhiên, cũng có một số nguy hiểm khi xác định đối tượng mục tiêu quá hẹp. Nghiên cứu chất lượng cao về các nhóm bệnh nhân rất cụ thể thường không có sẵn, và phân tích nhóm nhỏ, thay thế của các nghiên cứu lớn hơn, toàn diện hơn có thể gặp vấn đề do những lo ngại nghiêm trọng về phương pháp luận [ 5-14 ]. (Xem 'Giá trị bên ngoài' bên dưới.)
Can thiệp - Khi xây dựng câu hỏi PICO, điều quan trọng là phải xác định rõ biện pháp can thiệp đang được xem xét. Một cách tiếp cận tương tự được sử dụng để đánh giá các câu hỏi liên quan đến chẩn đoán hoặc tiên lượng, trong trường hợp đó câu hỏi phải nêu rõ xét nghiệm chẩn đoán cụ thể hoặc yếu tố nguy cơ cần quan tâm.
Đối với nhóm bệnh nhân, điều quan trọng là tránh các định nghĩa quá hẹp hoặc quá rộng về can thiệp (hoặc xét nghiệm hoặc yếu tố nguy cơ). Đối với các câu hỏi liên quan đến điều trị bằng thuốc, liều lượng, thời gian và thời gian điều trị cần được xem xét. Ví dụ, đối với một người đàn ông trung niên bị tăng huyết áp, người ta có thể muốn biết liệu dùng 81 mg aspirin hàng ngày có ngăn ngừa đột quỵ vô thời hạn hay không. Tuy nhiên, dữ liệu tốt về lịch trình điều trị được xác định trong phạm vi hẹp có thể không có sẵn, dẫn đến sự phụ thuộc nguy hiểm vào các phân tích phân nhóm. Trong những trường hợp như vậy, có thể nên nới lỏng định nghĩa về can thiệp sang một điều gì đó rộng hơn, chẳng hạn như “aspirin liều thấp”.
So sánh — Trong các thử nghiệm điều trị ngẫu nhiên, nhóm so sánh có thể là nhóm dùng giả dược, chăm sóc thông thường hoặc điều trị tích cực. Các thử nghiệm đối chứng với giả dược có hai ưu điểm khác biệt: chúng tạo điều kiện làm mù và kiểm soát tác dụng giả dược (tác dụng điều trị không đặc hiệu). Tuy nhiên, chúng không cho phép người ta so sánh tác động giữa các lựa chọn trong thế giới thực [ 15 ]. Điều quan trọng là biện pháp can thiệp so sánh phải phù hợp về mặt lâm sàng (nghĩa là một biện pháp can thiệp thay thế sẽ được xem xét trên thực tế).
Kết quả - Điều quan trọng là phải xem xét tất cả các kết quả quan trọng đối với bệnh nhân (bao gồm cả lợi ích và tác hại). Sẽ không đủ nếu chỉ nghĩ đến lợi ích (hoặc tác hại) một cách chung chung; người ta phải cụ thể về kết quả quan tâm. Đặc biệt, các kết quả phải được xác định rõ ràng, có thể đo lường được, đáng tin cậy, nhạy cảm với những thay đổi và phải thực sự đánh giá các khía cạnh liên quan đến lâm sàng về sức khỏe của bệnh nhân.
Các vấn đề cụ thể liên quan đến các loại kết quả được đo lường trong các nghiên cứu lâm sàng bao gồm:
●Điểm cuối tổng hợp – Việc sử dụng tổng hợp nhiều điểm cuối kết hợp có ưu điểm là tăng sức mạnh thống kê của nghiên cứu nhưng có thể khó diễn giải. Việc giải thích sẽ dễ dàng nếu sự can thiệp ảnh hưởng đến tất cả các kết quả thành phần ở mức độ như nhau. Nhưng khi các tác động can thiệp không nhất quán giữa các kết quả khác nhau và các kết quả được đánh giá khác nhau thì việc giải thích tổng hợp sẽ khó khăn. Vì lý do này, các nghiên cứu có tiêu chí tổng hợp cho kết quả chính cũng nên báo cáo kết quả cho từng kết quả riêng lẻ tạo nên kết quả tổng hợp.
Ví dụ, trong nhiều nghiên cứu điều trị tim mạch, kết quả tử vong được kết hợp với các kết quả bất lợi khác (ví dụ như nhồi máu cơ tim, cần thực hiện thủ thuật tái thông mạch máu). Vì những kết quả này có thể được đánh giá khác nhau nên việc sử dụng kết quả tổng hợp sẽ gây nhầm lẫn và không phù hợp khi tác động của biện pháp can thiệp không nhất quán giữa các mục tiêu khác nhau, đặc biệt nếu các tác động theo hướng ngược lại. Trong một nghiên cứu so sánh phẫu thuật bắc cầu mạch vành với nong mạch vành qua da và đặt stent cho bệnh động mạch vành nặng, kết quả nghiên cứu chính là sự kết hợp của tử vong, đột quỵ, nhồi máu cơ tim hoặc cần phải tái thông mạch máu lặp lại [ 16 ]. So với phẫu thuật bắc cầu, can thiệp qua da có nguy cơ đột quỵ thấp hơn đáng kể nhưng nguy cơ tái thông mạch máu lặp lại cao hơn đáng kể. Việc sử dụng điểm cuối kết hợp trong những trường hợp này sẽ là vô nghĩa.
●Kết quả “mềm” – Phần lớn nghiên cứu lâm sàng tập trung vào kết quả khách quan, bao gồm kết quả “cứng” về tử vong và bệnh tật (ví dụ, nhồi máu cơ tim, đột quỵ và mất chi). Các kết quả "nhẹ nhàng hơn" để đo lường chức năng, mức độ đau và chất lượng cuộc sống ít phổ biến hơn, nhưng, đối với nhiều câu hỏi, lại là kết quả chính được quan tâm. Thông thường, việc đo lường những kết quả khó đạt được thường dễ dàng mà không cần đến các dụng cụ đặc biệt. Mặt khác, những kết quả đòi hỏi sự giải thích chủ quan của bệnh nhân hoặc bác sĩ lâm sàng đòi hỏi một công cụ đo lường được xác nhận và phát triển cẩn thận. Kết quả chủ quan thường dễ bị ảnh hưởng bởi hiệu ứng giả dược hoặc sai lệch kỳ vọng hơn. Các chiến lược để giảm thiểu những lỗi này, chẳng hạn như che mắt thích hợp, trở nên cực kỳ quan trọng. Nhưng ngay cả những kết quả khách quan, khó khăn cũng có xu hướng thiên vị.
●Kết quả thay thế – Đôi khi những kết quả quan trọng nhất về mặt lâm sàng rất khó đo lường và kết quả thay thế trở thành sự thay thế dễ dàng hơn và rẻ hơn. Các kết quả thay thế dự kiến sẽ dự đoán lợi ích hoặc tác hại lâm sàng dựa trên dịch tễ học, sinh lý bệnh hoặc bằng chứng khoa học khác [ 17 ]. Ưu điểm của việc sử dụng kết quả thay thế thay vì kết quả lâm sàng là các nghiên cứu thường có thể được thực hiện với ít đối tượng hơn và hoàn thành nhanh hơn với chi phí thấp hơn. Những ưu điểm này giải thích cho việc sử dụng phổ biến các kết quả thay thế trong nghiên cứu lâm sàng (45% các loại thuốc mới được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ [FDA] phê duyệt từ năm 2005 đến năm 2012 đều dựa trên các nghiên cứu với kết quả thay thế) [ 18 ]. Các ví dụ phổ biến bao gồm huyết áp trong các thử nghiệm đánh giá thuốc hạ huyết áp và nồng độ hemoglobin A1c trong các thử nghiệm đánh giá thuốc trị tiểu đường.
Tuy nhiên, việc sử dụng các điểm cuối thay thế có thể dẫn đến kết luận sai lầm [ 19 ]. Hơn nữa, nghiên cứu sử dụng người thay thế có thể khó kết hợp vào đánh giá tổng thể về rủi ro và lợi ích vì theo định nghĩa, những kết quả này chỉ quan trọng gián tiếp đối với bệnh nhân. Khuyến nghị của Viện Y học (IOM) năm 2010 nêu rõ rằng chỉ nên sử dụng các kết quả cuối cùng thay thế nếu khả năng dự đoán các kết quả quan trọng về mặt lâm sàng của chúng được ghi chép một cách thuyết phục [ 17 ].
Ngay cả những người đại diện có trình độ tốt và có vẻ đáp ứng các tiêu chuẩn của IOM cũng có thể gặp vấn đề. Một ví dụ điển hình là việc sử dụng hemoglobin A1c như một chất thay thế hoặc chất thay thế cho các kết quả quan trọng về mặt lâm sàng của việc điều trị bệnh tiểu đường (tử vong, bệnh tật và rối loạn chức năng). Một số liệu pháp đã chứng minh mức giảm ấn tượng của hemoglobin A1c sau đó được phát hiện là không có tác dụng hoặc gây hại đối với các kết quả liên quan đến lâm sàng. (Xem “Kiểm soát đường huyết và biến chứng mạch máu ở bệnh đái tháo đường týp 2” .)
TÌM HIỂU BẰNG CHỨNG
Tài nguyên EBM - Hầu hết thông tin y tế hiện có thể truy cập nhanh chóng từ máy tính và thiết bị cầm tay. Tuy nhiên, cần có kỹ năng để nhanh chóng tìm thấy thông tin mong muốn, đồng thời hạn chế những “tiếng ồn” không liên quan. Tùy thuộc vào lý do tìm kiếm thông tin, cần có các cách tiếp cận khác nhau:
●Trả lời nhanh chóng một câu hỏi lâm sàng cụ thể, nền tảng của EBM, đòi hỏi một chiến lược nhanh chóng và chính xác và hầu hết các bác sĩ có thể nắm vững mà không cần sự phức tạp về mặt kỹ thuật.
●Luôn cập nhật những phát triển trong lĩnh vực của mình ("quản lý kiến thức") là một thách thức và thường không khả thi nếu không sử dụng nguồn tài nguyên được quản lý. Trả lời tất cả các câu hỏi lâm sàng quan trọng bằng cách đọc, đánh giá và tóm tắt bằng chứng sẽ là quá sức và đơn giản là không thể đối với từng bác sĩ lâm sàng. Vì vậy, phần lớn các nhiệm vụ này phải được giao cho các nguồn đáng tin cậy. UpToDate là tài nguyên cho mục đích này; nhiều tài nguyên khác có sẵn trực tuyến. Tuy nhiên, thực tế là một nguồn tài liệu là điện tử và có thể truy cập dễ dàng không có nghĩa là nó dựa trên bằng chứng. Ví dụ, Wikipedia thường được sử dụng để trả lời các câu hỏi lâm sàng [ 20 ]. Tuy nhiên, các mục trên Wikipedia có thể có những thiếu sót lớn và được đánh giá là không phù hợp để thực hành EBM [ 21-24 ].
●Việc tiến hành đánh giá có hệ thống đòi hỏi phải tìm kiếm toàn diện dữ liệu chính bằng nhiều công cụ tìm kiếm. Điều này được thảo luận riêng. (Xem "Đánh giá hệ thống và phân tích tổng hợp" .)
Chất lượng của các nguồn thông tin hữu ích cho bác sĩ lâm sàng bao gồm:
●Truy cập nhanh chóng (trong vòng vài phút) để thông tin có thể hướng dẫn các quyết định lâm sàng khi chúng phát sinh
●Nhắm mục tiêu vào câu hỏi lâm sàng cụ thể
●Thông tin nghiên cứu hiện tại dựa trên bằng chứng
●Cầm tay
●Dễ dàng sử dụng
Trong lĩnh vực công nghệ thông tin, có sự phân biệt giữa cơ sở dữ liệu là tập hợp các tài liệu tham khảo thư mục về các bài báo y tế (ví dụ: Hệ thống truy xuất và phân tích tài liệu y tế trực tuyến [MEDLINE], Chỉ mục tích lũy về điều dưỡng và tài liệu về sức khỏe liên quan [CINAHL] , cơ sở dữ liệu Excerpta Medica [EMBASE], cơ sở dữ liệu Cochrane) và cổng truy cập, là giao diện người dùng với công cụ tìm kiếm tích hợp (ví dụ: PubMed, Ovid).
Mỗi cổng truy cập có thể có quyền truy cập vào nhiều cơ sở dữ liệu. Cổng truy cập cũng có thể cung cấp các tùy chọn để quản lý trích dẫn và bản đồ trích dẫn. Bản đồ trích dẫn là mạng lưới các liên kết trích dẫn giữa các bài viết khác nhau trong cơ sở dữ liệu. Đây có thể là gửi đi (các bài báo được trích dẫn trong thư mục của một bài báo cụ thể) hoặc đến (các báo cáo khác, gần đây hơn, trích dẫn bài viết chỉ mục). Do đó, việc khám phá các bản đồ trích dẫn là một phương pháp hợp pháp để tìm kiếm tài liệu, đôi khi mang lại những kết quả mới và hữu ích.
Bộ lọc tìm kiếm (còn gọi là "hàng rào", "giới hạn", "chiến lược" và "truy vấn lâm sàng") là các cụm từ tìm kiếm được xác định trước được thiết kế cho một mục đích cụ thể (ví dụ: giới hạn tìm kiếm theo hướng dẫn hoặc thử nghiệm ngẫu nhiên có kiểm soát). Đây là cả cổng thông tin và cơ sở dữ liệu cụ thể. Bởi vì các bộ lọc dành riêng cho nền tảng nên kết quả có thể rất khác nhau đối với các tìm kiếm có vẻ giống hệt nhau.
Các loại bằng chứng - Bằng chứng có thể được tóm tắt ở ba mức độ phức tạp ( hình 3 ) [ 25 ]:
●Nghiên cứu sơ cấp (ban đầu) – Nghiên cứu sơ cấp bao gồm dữ liệu được thu thập từ các cá nhân hoặc cụm cá nhân, với các cụm được xác định bởi bác sĩ, phòng khám, khu vực địa lý hoặc các yếu tố khác. Trong nghiên cứu sơ cấp, những người thực hiện EBM nên xem xét thứ bậc của bằng chứng để giảm thiểu nguy cơ sai lệch ( hình 3 ). Đối với các nghiên cứu đánh giá liệu pháp điều trị hoặc tác hại, các thử nghiệm lâm sàng ngẫu nhiên được tiến hành tốt sẽ vượt trội hơn so với các nghiên cứu quan sát, vượt trội hơn so với các quan sát lâm sàng không có hệ thống [ 25 ]. Thiết kế nghiên cứu phù hợp phụ thuộc vào câu hỏi đang được nghiên cứu ( hình 4 ). Các câu hỏi liên quan đến lợi ích (và tác hại) của một biện pháp can thiệp được trả lời tốt nhất bằng các thử nghiệm ngẫu nhiên có đối chứng; trong khi các câu hỏi liên quan đến các yếu tố nguy cơ mắc bệnh và tiên lượng bệnh được trả lời tốt nhất bằng các nghiên cứu đoàn hệ tương lai.
●Đánh giá có hệ thống – Đánh giá có hệ thống là tốt nhất để trả lời các câu hỏi đơn lẻ (ví dụ: hiệu quả của việc kiểm soát chặt chẽ đường huyết đối với các biến chứng mạch máu nhỏ của bệnh tiểu đường). Chúng có cấu trúc khoa học hơn so với các bài đánh giá truyền thống, nêu rõ cách tác giả cố gắng tìm tất cả các bài báo liên quan, đánh giá chất lượng khoa học của từng nghiên cứu và cân nhắc bằng chứng từ nhiều nghiên cứu có kết quả trái ngược nhau. Những đánh giá này đặc biệt chú ý đến việc bao gồm tất cả các nghiên cứu có giá trị, dù đã được xuất bản hay chưa, để tránh sai lệch xuất bản (ưu tiên các nghiên cứu tích cực được xuất bản). Đánh giá hệ thống và phân tích tổng hợp được thảo luận chi tiết hơn một cách riêng biệt. (Xem "Đánh giá hệ thống và phân tích tổng hợp" .)
●Tóm tắt và hướng dẫn – Tóm tắt và hướng dẫn thể hiện mức độ phức tạp cao nhất. Lý tưởng nhất, các hướng dẫn là sự tổng hợp các đánh giá có hệ thống, nghiên cứu ban đầu, chuyên môn lâm sàng và sở thích của bệnh nhân. Ở mức tốt nhất, các bản tóm tắt và hướng dẫn là sự tổng hợp toàn diện các bằng chứng tốt nhất hiện có, từ đó các hướng dẫn sẽ tuân theo. Do đó, các hướng dẫn phải dựa trên sự đánh giá quan trọng của nghiên cứu ban đầu có liên quan và các đánh giá có hệ thống. Chất lượng của các hướng dẫn được xuất bản rất khác nhau, ngay cả trong số những hướng dẫn được tài trợ bởi các tổ chức chuyên nghiệp, với một số ví dụ về nhiều hướng dẫn về cùng một chủ đề đưa ra các khuyến nghị trái ngược nhau [ 26 ]. Các tiêu chuẩn để phát triển hướng dẫn đã được đưa ra bởi một số tổ chức bao gồm Nhóm làm việc Đánh giá, Phát triển và Đánh giá Khuyến nghị (GRADE), Viện Y học và Hợp tác Đánh giá Hướng dẫn, Nghiên cứu và Đánh giá (AGREE) [ 27- 32 ]. Các tiêu chuẩn này được xác nhận bởi nhiều tổ chức, bao gồm Viện Tim, Phổi và Máu Quốc gia Hoa Kỳ (NHLBI); Viện Y tế và Chăm sóc Sức khỏe Xuất sắc (NICE) Quốc gia Anh [ 33 ]; Trường Cao đẳng Bác sĩ Hoa Kỳ; Hợp tác Cochrane; và UpToDate [ 34 ].
Các tiêu chuẩn được chấp nhận để phát triển hướng dẫn bao gồm:
•Dựa vào đánh giá có hệ thống
•Đánh giá chất lượng của bằng chứng sẵn có
•Đánh giá sức mạnh của các đề xuất
•Tạo mối liên hệ rõ ràng giữa bằng chứng và khuyến nghị
UpToDate sử dụng cách tiếp cận của Nhóm làm việc GRADE để đưa ra khuyến nghị. Thông tin chi tiết được cung cấp trên Trang web Chính sách Biên tập của chúng tôi .
ĐÁNH GIÁ GIÁ TRỊ CỦA BẰNG CHỨNG — Các bác sĩ lâm sàng cần có các kỹ năng cần thiết để đánh giá một cách phê phán các bài báo nghiên cứu quan trọng đối với hoạt động thực hành của họ. Kỹ năng đánh giá quan trọng nâng cao khả năng làm chủ và tự chủ trong thực hành y học. Ngoài ra, kỹ năng đánh giá phản biện có thể giúp các bác sĩ lâm sàng lựa chọn nguồn thông tin họ sử dụng một cách khôn ngoan hơn, ưu tiên những nguồn có tiêu chuẩn rõ ràng để cân nhắc bằng chứng. Những kỹ năng này cũng có thể giúp việc đọc thông thường hiệu quả hơn bằng cách giúp bạn dễ dàng tập trung vào những bài viết đặc biệt mạnh và bỏ qua những bài yếu. Có rất nhiều cơ hội để học các kỹ năng đọc quan trọng từ sách [ 35 ], các bài báo, khóa học và các phiên họp đặc biệt của các cuộc họp chuyên môn.
Hiện có một số hướng dẫn mô tả các tiêu chuẩn để tiến hành và báo cáo các loại nghiên cứu khác nhau. Bộ hướng dẫn được Ủy ban Biên tập Tạp chí Y khoa Quốc tế xác nhận có thể tạo điều kiện thuận lợi cho việc đánh giá quan trọng các nghiên cứu riêng lẻ dựa trên loại nghiên cứu:
●Đánh giá hệ thống và phân tích tổng hợp – Các mục báo cáo ưu tiên để đánh giá hệ thống và phân tích tổng hợp (PRISMA) [ 36 ] và Giao thức PRISMA (PRISMA-P) [ 37 ]
●Các thử nghiệm ngẫu nhiên có đối chứng – Tiêu chuẩn hợp nhất của các thử nghiệm báo cáo (CONSORT) [ 38 ] và các hạng mục trong quy trình tiêu chuẩn: Khuyến nghị cho các thử nghiệm can thiệp (SPIRIT) [ 39 ]
●Nghiên cứu quan sát - Tăng cường Báo cáo về Nghiên cứu Quan sát trong Dịch tễ học (STROBE) [ 40 ]
●Nghiên cứu chẩn đoán và tiên lượng - Tiêu chuẩn báo cáo độ chính xác chẩn đoán (STARD) [ 41 ] và Báo cáo minh bạch về mô hình dự đoán đa biến cho Tiên lượng hoặc chẩn đoán cá nhân (TRIPOD) [ 42,43 ]
Trọng tâm của đánh giá phản biện là đánh giá cả giá trị bên trong và tính khái quát (giá trị bên ngoài) ( hình 5 ).
Giá trị nội bộ - Giá trị nội bộ đề cập đến câu hỏi liệu kết quả nghiên cứu lâm sàng có chính xác đối với bệnh nhân được nghiên cứu hay không. Các mối đe dọa đối với giá trị nội tại bao gồm sự thiên vị và cơ hội:
●Xu hướng – Xu hướng là bất kỳ lỗi hệ thống nào có thể tạo ra ấn tượng sai lệch về tác động thực sự. Các thử nghiệm ngẫu nhiên được thực hiện với mục đích giảm sai lệch và các thử nghiệm được tiến hành tốt thường có nguy cơ sai lệch thấp. Tuy nhiên, những sai sót trong việc tiến hành thử nghiệm lâm sàng có thể tạo ra kết quả sai lệch.
Các nguồn sai lệch tiềm ẩn trong các thử nghiệm ngẫu nhiên bao gồm:
•Không che giấu việc phân công ngẫu nhiên đối tượng đăng ký học
•Không làm mù các cá nhân có liên quan (bao gồm những người tham gia nghiên cứu, bác sĩ lâm sàng, người thu thập dữ liệu, người đánh giá kết quả và nhà phân tích dữ liệu) khi phân công nhóm
•Mất theo dõi (thiếu dữ liệu kết quả)
•Không tuân thủ sự can thiệp được chỉ định
•Dừng sớm vì lợi ích
•Ưu tiên xuất bản các nghiên cứu nhỏ (không đủ sức mạnh) với kết quả có ý nghĩa thống kê (xu hướng xuất bản)
●Cơ hội – Cơ hội là lỗi ngẫu nhiên, cố hữu trong mọi quan sát. Khả năng ngẫu nhiên tạo ra kết quả sai có thể được giảm thiểu bằng cách nghiên cứu một số lượng lớn bệnh nhân. Giá trị P thường bị hiểu sai là khả năng các phát hiện chỉ là ngẫu nhiên. Thay vào đó, giá trị p mô tả xác suất mà nếu giả thuyết không là đúng thì nghiên cứu sẽ tìm thấy sự khác biệt lớn hoặc lớn hơn so với kết quả tìm thấy. (Xem "Bằng chứng, giá trị p và kiểm tra giả thuyết" .)
Giá trị bên ngoài - Giá trị bên ngoài đề cập đến câu hỏi liệu kết quả của nghiên cứu có áp dụng cho các bệnh nhân bên ngoài nghiên cứu hay không, đặc biệt là bệnh nhân (hoặc nhóm dân số) cụ thể đang được bác sĩ EBM xem xét. Bệnh nhân nghiên cứu thường được chọn lọc kỹ càng, không giống như bệnh nhân trong thực hành thông thường. Thông thường, họ đã được chuyển đến các trung tâm y tế hàn lâm, đáp ứng các tiêu chí tuyển chọn nghiêm ngặt, không có các tình trạng hoặc rối loạn có khả năng gây nhiễu và sẵn sàng đáp ứng các yêu cầu khắt khe của quy trình nghiên cứu. Kết quả là, họ có thể khác biệt một cách có hệ thống với những bệnh nhân mà hầu hết các bác sĩ gặp trong thực tế. Đặc biệt, đối tượng nghiên cứu trong các thử nghiệm điều trị thường có nguy cơ thấp gặp phải các kết quả nghiên cứu bất lợi đáng quan tâm (tử vong, bệnh tật, rối loạn chức năng, không hài lòng). Bởi vì lợi ích điều trị thường chỉ giới hạn ở những bệnh nhân có nguy cơ cao hơn, do đó, không có gì lạ khi kết quả nghiên cứu chỉ áp dụng cho một số ít đối tượng nghiên cứu có nguy cơ cơ bản đủ cao [ 44,45 ]. Mặc dù quy mô hiệu quả điều trị thường liên quan đến nguy cơ cơ bản, nhưng nhiều nghiên cứu không đo lường được mối quan hệ này, khiến việc đánh giá xem liệu kết quả nghiên cứu có áp dụng cho một bệnh nhân cụ thể hay không và như thế nào trở nên khó khăn hơn.
Bằng chứng gián tiếp - Khi một nghiên cứu liên quan đến một nhóm dân số hơi khác so với mối quan tâm của người thực hành EBM (ví dụ: già hơn, trẻ hơn, ốm yếu hơn, khỏe mạnh hơn), một số người có thể có xu hướng bác bỏ hoàn toàn bằng chứng đó, cho rằng nó "không áp dụng cho trường hợp của tôi". kiên nhẫn." Trên thực tế, loại bằng chứng gián tiếp này có thể giúp cung cấp thông tin cho việc ra quyết định y tế, đặc biệt khi không có bằng chứng trực tiếp. Tuy nhiên, niềm tin của chúng tôi vào kết quả mong đợi nhìn chung thấp hơn so với bằng chứng trực tiếp.
Phân tích phân nhóm - Khi nghiên cứu không đề cập đến nhóm bệnh nhân quan tâm cụ thể, một chiến lược là dựa vào phân tích phân nhóm để đánh giá kết quả theo các đặc điểm khác nhau của bệnh nhân (ví dụ: tuổi, giới tính, mức độ nghiêm trọng của bệnh). Tuy nhiên, cần thận trọng khi diễn giải kết quả phân tích phân nhóm để tránh đưa ra kết luận sai. Các vấn đề tiềm ẩn bao gồm:
●Sai lệch báo cáo – Các phân tích phân nhóm có trong các báo cáo đã xuất bản có thể đại diện cho một tập hợp con chọn lọc của tất cả các phân tích được thực hiện. Các phân tích phân nhóm "thú vị" được ưu tiên trình bày, tạo ra xu hướng báo cáo tích cực [ 9,46 ].
●Nhiều so sánh – Cho dù kiểm tra nhiều kết quả khác nhau hoặc các phân nhóm bệnh nhân khác nhau, xác suất tìm thấy ít nhất một phát hiện có ý nghĩa thống kê giả sẽ tăng khi số lượng phân tích tăng [ 47 ]. Có lẽ minh họa nổi tiếng nhất về tác dụng này là báo cáo về một thử nghiệm ngẫu nhiên so sánh streptokinase, aspirin , cả hai hoặc không dùng cả hai trong điều trị nhồi máu cơ tim cấp tính [ 48 ]. Các tác giả nói đùa đã báo cáo phân tích phân nhóm theo cung chiêm tinh. Những đối tượng sinh ra dưới các cung Song Tử hoặc Thiên Bình có tỷ lệ tử vong cao hơn một chút do dùng aspirin, trong khi những đối tượng sinh ra dưới các cung chiêm tinh khác có tỷ lệ tử vong giảm đáng kể (p<0,00001).
●Sức mạnh thống kê thấp hơn – Phân tích nhóm phụ luôn liên quan đến ít đối tượng hơn so với phân tích chính, nghĩa là nhiều đối tượng không đủ sức mạnh để phát hiện tác động thực sự (kết quả âm tính giả). Khi các phân tích nhóm phụ không đủ mạnh được kết hợp với báo cáo chọn lọc, có nhiều khả năng kết quả nhóm phụ dương tính là dương tính giả và mức độ ảnh hưởng bị phóng đại [ 3,49-52 ].(Xem "Bằng chứng, giá trị p và kiểm tra giả thuyết ", phần 'Sức mạnh trong một nghiên cứu tiêu cực' .)
Để giảm thiểu rủi ro đưa ra kết luận sai từ các phân tích phân nhóm, những người thực hành EBM nên hỏi những câu hỏi sau [ 11,12,14 ]:
●Các phân tích của nhóm nhỏ có được xác định một cách tiên nghiệm, bao gồm các giả thuyết về hướng đi của sự khác biệt không?
●Các phân nhóm được xác định bởi rủi ro cơ bản (một cách tiếp cận thường hữu ích) hay bởi các sự kiện sau ngẫu nhiên hóa, chẳng hạn như tuân thủ điều trị hoặc thay đổi các biến số có thể bị ảnh hưởng bởi điều trị (một cách tiếp cận thường gây hiểu lầm)?
●Có phải số lượng phân tích phân nhóm chỉ giới hạn ở một số ít?
●Sự khác biệt giữa các nhóm nhỏ có được phân tích bằng cách kiểm tra sự thay đổi hiệu ứng (tương tác) thay vì các thử nghiệm thống kê riêng biệt cho từng nhóm nhỏ không?
●Nếu nhiều phân tích được thực hiện, kỹ thuật thống kê thích hợp có được sử dụng để giải thích cho nhiều so sánh (kỹ thuật Bayes hoặc nâng cao ngưỡng có ý nghĩa thống kê) không?
●Phân tích phân nhóm có giới hạn ở kết quả chính không? Việc khám phá những khác biệt giữa các nhóm nhỏ trong tất cả các kết quả thứ cấp sẽ làm trầm trọng thêm vấn đề về bội số.
●Có phải tác động chỉ được nhìn thấy trong các phân tích phân nhóm khi kết quả nghiên cứu chính là âm tính? Điều này đặc biệt có khả năng cho thấy kết quả dương tính giả và cần được xem xét với thái độ hết sức hoài nghi.
Sự khác biệt giữa các phân nhóm được báo cáo trong các thử nghiệm ngẫu nhiên có đối chứng thường có thiếu sót ở một hoặc nhiều loại này, đặc biệt là không chỉ định các phân tích tiên nghiệm của phân nhóm và không kiểm tra sự thay đổi hiệu ứng (tương tác) và rất ít được chứng thực trong phân tích tổng hợp hoặc kiểm soát ngẫu nhiên tiếp theo. thử nghiệm [ 53 ]. Tuy nhiên, đối với các nghiên cứu điều trị, nghiên cứu lâm sàng có giá trị cao hầu như luôn bao gồm phân tích phân nhóm được xác định trước về lợi ích điều trị tuyệt đối thay đổi như thế nào theo sự liên tục của điểm rủi ro được xác định bởi nhiều biến số cơ bản được xem xét cùng nhau [ 54 ]. Điều này là do, đối với nhiều phương pháp điều trị, hiệu quả điều trị tuyệt đối lớn hơn nhiều ở nhóm thiểu số có nguy cơ cao và nhỏ hơn ở nhóm đa số có nguy cơ thấp hơn.
ÁP DỤNG BẰNG CHỨNG TRONG THỰC HÀNH — Thường có khoảng cách giữa các khuyến nghị từ bằng chứng tốt nhất hiện có và thực tiễn thực tế. Lý do cho khoảng cách là rất nhiều, bao gồm cả sự không chắc chắn liệu kết quả của các nghiên cứu lớn có áp dụng cho từng bệnh nhân hay không, thiếu nhận thức hoặc hiểu sai về bằng chứng và không tổ chức chăm sóc theo cách thúc đẩy việc sử dụng bằng chứng [ 55 ].
EBM không nhằm mục đích thay thế phán đoán lâm sàng [ 56 ]. Các bệnh nhân riêng lẻ cần được chăm sóc dựa trên các bằng chứng nghiên cứu tốt nhất hiện có, nhưng với sự chăm sóc phù hợp với hoàn cảnh cá nhân của họ, bao gồm cấu trúc di truyền, các bệnh trong quá khứ và hiện tại, các hành vi liên quan đến sức khỏe và sở thích cá nhân. Một số nghiên cứu chứng minh rõ ràng rằng nhiều quyết định lâm sàng không được đưa ra dựa trên bằng chứng nghiên cứu tốt nhất hoặc đặc điểm liên quan của từng bệnh nhân, mà dường như phù hợp nhất với thói quen thực hành hoặc phong cách thực hành của bác sĩ lâm sàng.
Một lượng lớn nghiên cứu cũng như kinh nghiệm thực tế đã chứng minh rằng tất cả chúng ta, khi chăm sóc bệnh nhân, đều mắc phải những sai sót mang tính hệ thống do bỏ sót hoặc sai phạm, so với bằng chứng nghiên cứu tốt nhất hiện có. Ví dụ nổi bật là việc kê đơn thuốc kháng sinh rộng rãi cho bệnh ho cấp tính hoặc sử dụng xét nghiệm X quang để điều trị chứng đau thắt lưng cấp tính không biến chứng.
Trong một số trường hợp, việc không thực hành theo bằng chứng tốt nhất hiện nay là do thiếu hụt kiến thức. Nhưng chỉ có kiến thức thôi thì hiếm khi thay đổi được hành vi [ 56 ]. Thay đổi hành vi thường đòi hỏi sự kết hợp của các biện pháp can thiệp và tác động, bao gồm cả thời gian để suy nghĩ lại về thói quen thực hành. Bảng này liệt kê những ảnh hưởng có thể có đối với hành vi của bác sĩ lâm sàng, gần như theo thứ tự mức độ giảm dần, dựa trên tài liệu nghiên cứu ngày càng tăng về sự thay đổi hành vi của bác sĩ và ý thức chung ( bảng 3 ). Thông thường, không có ảnh hưởng đơn lẻ nào đủ mạnh để tạo ra những thay đổi quan trọng; sự kết hợp là cần thiết.
TÓM TẮT VÀ KIẾN NGHỊ
●Y học dựa trên bằng chứng (EBM) là dịch vụ chăm sóc bệnh nhân sử dụng bằng chứng nghiên cứu tốt nhất hiện có để hướng dẫn việc ra quyết định lâm sàng ( hình 1 ). Các yếu tố cơ bản của y học dựa trên bằng chứng bao gồm (xem phần 'Giới thiệu' ở trên):
•Xây dựng một câu hỏi lâm sàng
•Tìm kiếm bằng chứng tốt nhất hiện có
•Đánh giá tính giá trị của bằng chứng (bao gồm giá trị bên trong và bên ngoài)
•Áp dụng bằng chứng vào thực tế, kết hợp với chuyên môn lâm sàng và sở thích của bệnh nhân
●Việc tìm kiếm câu trả lời tốt nhất cho một câu hỏi lâm sàng bắt đầu bằng việc xác định chặt chẽ câu hỏi. Khi đặt câu hỏi liên quan đến hiệu quả của một biện pháp can thiệp, cần xem xét bốn thành phần (PICO: dân số bệnh nhân, can thiệp, so sánh, kết quả) ( bảng 2 ). (Xem 'Xây dựng câu hỏi lâm sàng' ở trên.)
●Bằng chứng có thể được tóm tắt ở ba mức độ phức tạp: nghiên cứu sơ bộ, đánh giá có hệ thống, tóm tắt và hướng dẫn ( hình 3 ). Thiết kế nghiên cứu phù hợp phụ thuộc vào câu hỏi đang được nghiên cứu ( hình 4 ). (Xem 'Các loại bằng chứng' ở trên.)
●Các bác sĩ lâm sàng nên có những kỹ năng cần thiết để đánh giá một cách nghiêm túc các bài báo nghiên cứu quan trọng đối với việc thực hành của họ. Kỹ năng đánh giá quan trọng nâng cao khả năng làm chủ và tự chủ trong thực hành y học. Trọng tâm của đánh giá phản biện là đánh giá cả giá trị bên trong và tính khái quát (giá trị bên ngoài) ( hình 5 ). (Xem 'Đánh giá tính hợp lệ của bằng chứng' ở trên.)
●Việc thực hiện đầy đủ EBM phải bao gồm một kế hoạch thực tế để thay đổi hành vi lâm sàng khi cần thiết ( bảng 3 ). Việc triển khai này phải bao gồm nhưng không giới hạn ở việc tiếp cận thông tin. (Xem 'Áp dụng bằng chứng vào thực tế' ở trên.)