gravatar

lengockhanhi

Lê Ngọc Khả Nhi

Recently Published

Naive Bayes ứng dụng Y khoa
Trong bài này, Nhi muốn giới thiệu đến các bạn đồng nghiệp về một giải thuật (algorithm) cổ điển bên phái Machine learning, có tên là Naive Bayes, những ưu thế và hạn chế của nó khi áp dụng giải quyết vấn đề trong chuyên khoa Y.
Association rule
Quy luật kết hợp thay thế cho bảng chéo và Chi2 test
Đánh giá mô hình phân loại
25 chỉ số để đánh giá hiệu năng của một mô hình phân loại, giao thoa Machine learning và Y học lâm sàng.
Exploring Datasaurus
Thí nghiệm datasaurus với 13 biến thể dữ liệu và bài học rút ra
Overplotting ggplot2
Giải pháp khắc phục hiện tượng chồng lắp khi vẽ biểu đồ với rất nhiều cases.
Package broom
Công dụng của broom là trích xuất nội dung của một output object - kết quả của một mô hình thống kê và tóm tắt thông tin này vào một dataframe. Tên gọi broom chính là để diễn tả việc dọn dẹp từ một mô hình rối rắm thành một dataframe gọn gàng, sạch đẹp, sẵn sàng để đưa vào báo cáo, hoặc làm nguyên liệu để vẽ những biểu đồ.
Diễn giải Random Forest
Một package vừa được công bố vào cuối tháng 7 năm 2017 bởi tác giả Aleksandra Paluszyńska. Công dụng của package này cho phép khảo sát nội dung bên trong một mô hình Random Forest.
Gamlss 7: Mô hình Lambda-Mu-Sigma
Mô hình LMS không còn là phương pháp độc quyền của những tổ chức quốc tế nữa. Các bạn bác sĩ Việt Nam hoàn toàn có thể tự tạo mô hình LMS cho riêng mình.
BRMS1: Bayesian Logistic GAM
Trong bài đầu tiên này, chúng ta sẽ làm quen với một trong những tính năng mới của brms, đó là tích hợp những hàm Smoothing (splines, tensor product…) vào mô hình GLM và tạo ra mô hình GAM.
Dplyr tutorial
Hướng dẫn sử dụng dplyr
DRMnet
Vào tháng 9 vừa qua, một vũ khí mới được bổ sung vào danh sách này, đó là package DMRnet của Agnieszka Prochenka-Sołtys và Piotr Pokarowski
Correlation network
Correlation network 2
Vẽ 1 chùm bong bóng tương quan
Giới thiệu ggridges
Một package mới cho phép đảo chiều và tách biệt density curve và histogram
BAYES: Hồi quy Nhị thức âm
Đây cũng là một bài giảng với tham vọng cao nhất,vì chúng tôi sẽ đề cập đồng thời nhiều vấn đề tương đối phức tạp, bao gồm: Phân tích biến số đếm (count data) bằng phân phối Nhị thức âm, mixed model có chứa random effect, và Hồi quy tuyến tính đa biến
BAYES: ANOVA lặp lại
Trong bài này chúng ta sẽ thay thế phân tích phương sai cho thí nghiệm lặp lại (Repeated measure ANOVA) bằng mô hình hỗn hợp và hồi quy Bayes.
BAYES: ANOVA đơn biến
Trong bài hôm nay chúng ta sẽ thay thế phân tích phương sai 1 yếu tố (One-way ANOVA) bằng phương pháp hồi quy Bayes. Đây cũng là lần đầu tiên một bài giảng có sự góp sức của tất cả 4 thành viên trong Core team của project.
Diễn giải mô hình bất khả tri bằng LIME
Giới thiệu phương pháp LIME cho phép giải thích bất cứ mô hình nào, kể cả mô hình blackbox
BAYES Phân tích tương quan (Pearson's r)
Thay thế phân tích tương quan cổ điển bằng phương pháp Bayes.
BAYES Chisquared test
Bài thứ 3 trong project Bayes for Vietnam, có mục tiêu thay thế test Chi2 cổ điển bằng 2 quy trình BAYES.
Bayes T test
Mục tiêu của bài thực hành này là giới thiệu một cách tiếp cận hoàn toàn mới theo trường phái Bayes để so sánh 2 phân nhóm, thay thế cho test t.
STAN1 Logistic regression
Hồi quy logistic theo BAYES sử dụng STAN và giao thức rstanarm
Mô hình liên hợp BAYES
Trong bài trước, chúng ta đã làm quen với package JM cho phép dựng mô hình Joint model bằng phương pháp REML. Như đã hứa, Nhi sẽ giới thiệu tiếp một package khác (của cùng tác giả Rizoupoulos) cho phép dựng Joint model bằng phương pháp Bayes.
Mô hình liên hợp (Joint model)
Mô hình liên hợp (Joint model) cho phép chúng ta hợp nhất hai bộ phận tưởng chừng như độc lập trong một thử nghiệm lâm sàng, đó là bài toán Longitudinal analysis và bài toán Survival analysis.
Toán tử Pipes trong R
Ba năm về trước, sự ra đời của package « magrittr » và những toán tử « Pipes » đã tạo ra một thay đổi mang tính cách mạng cho ngôn ngữ R. Toán tử pipe không chỉ thay đổi về cách thức viết R code, làm cho R code trong sáng và được cấu trúc tốt hơn mà còn thay đổi cách tư duy của người dùng R.
Gamlss 6: Thành phần đa thức
Chúng ta không thể chỉ dùng duy nhất mô hình hồi quy tuyến tính để mô tả về thế giới phi tuyến tính.
Gamlss 5: Thành phần tham số tuyến tính
Mô hình gamlss có 2 đặc tính quan trọng : thứ nhất là chuyên biệt cho tham số của họ phân phối xác định, thứ hai là có cấu trúc nhiều thành phần, bao gồm 3 phần chính là : tham số, bù trừ và ngẫu nhiên. Phần tham số lại chia ra thành 2 loại bao gồm tuyến tính và phi tuyến tính. Bài hôm nay Nhi sẽ giới thiệu sơ lược về thành phần tham số tuyến tính (các yếu tố tuyến tính này có thể gia giảm nên còn được gọi là phần cộng thêm : linear parametric additive term).
Gamlss 4: Thành phần bất định (Random Effect)
Bài này giới thiệu 1 số thuật ngữ về mixed model, random effect và 4 hàm gamlss cho phép đưa random effect vào mô hình.
Gamlss 3: Suy diễn thống kê
Suy diễn thống kê cho mô hình hồi quy giúp đưa ra câu trả lời cho 3 câu hỏi : thăm dò dữ liệu để phát hiện quy luật, dùng mô hình để chứng minh quy luật và giả thuyết, và dùng mô hình như 1 quy luật để tiên lượng hoặc phân loại. Với mô hình hồi quy, việc diễn giải dựa vào hệ số hồi quy của mô hình. Bootstrap là một giải pháp rất hữu ích để khẳng định về độ tin cậy của kết quả suy diễn hệ số hồi quy. Kiểm định độc lập mô hình là bắt buộc và rất quan trọng để có thể sử dụng mô hình như một quy tắc thực hành.
Gamlss 2: Gamlss là 1 thư viện khổng lồ về lý thuyết xác suất
Trong bài thực hành thứ 2 của series về Gamlss này, Nhi muốn chuyển đến các bạn 3 thông điệp như sau: 1) Khái niệm về thành phần phân phối trong cấu trúc mô hình GAM 2) Cách thăm dò và chọn lọc quy luật phân phối phù hợp cho mô hình 3) Quy trình Stepwise và Kfold cross validation
Suy diễn nhân quả và giải pháp từ chuyên ngành khác
Ngoài công việc chuyên môn, chúng ta nên quan sát và học hỏi thêm từ các chuyên ngành, lĩnh vực khác như Kinh tế học, Xã hội học, Tâm lý học. Bên đó người ta có những phương pháp thống kê độc đáo mà nếu mình lĩnh hội được thì có thể mang áp dụng cho chuyên môn của mình.
Gamlss 1: Tại sao phải dùng Gamlss ?
Có thể nói Gamlss là võ lâm chí tôn cho phái hồi quy. Nó là 1 framework phức tạp và tổng quát nhất cho mô hình hồi quy.