Archive for the ‘Biostatistics/SAS/Python’ Category

延續上一篇 [SAS] Proc Document – Copy 提到過,在跑 proc report 的時候,可以利用 ods document 來生成相關的 metadata 以利之後的再運用。要去後製 metadata,可以使用 proc document 這個 procedure 指令了。

上一次我們是用 的 copy 方式去移動書籤,其實還有 move 這指令。這次我們就用 move 來移動 report。直接先來看看單純用 move 的產出會是什麼樣。同樣我們也會介紹 hide 以及 unhide 這兩個可以調整產出的指令。

(繼續閱讀…)

台灣的COVID疫苗開打前有很多不良反應的謠傳,但現在全世界比較有規模的統計報告應該只有英國的Yellow Page Summary有發佈,美國因為還沒有給所有廠牌EUA,所以美國的VAERS目前只有Pfizer/Biontech和Moderna兩支疫苗的數據。而這兩支台灣目前還看得到打不到,所以還是AZ的Data比較有幫助。

英國Yellow Page Summary是固定時間出PDF報告,但是PDF不太方便做Sorting和觀察Signal。現在很多Python大神開源可以一步轉PDF ,這次來把轉檔和畫圖過程筆記下來,也順便做個介紹。

英國現在應該是每週定期釋出各廠牌COVID Vaccine SAE summary的PDF檔,目前可以在頁面下載。然後還是要先聲明一下,就像Yellow Page釋出report時再次提醒,這份定期報告「非正式報告」,是為了給醫療專業人士參考,並不代表任何結論。此一筆記也是做為練習使用,練習過程的Python code也不完整,其統計內容與現況絕不相符,請勿引用。

UK Yellow Card Summary statement: “This information does not represent an overview of the potential side effects associated with the vaccines. A list of the recognised adverse effects of COVID-19 vaccines is provided in the information for healthcare professionals and the recipient information here. These can also be found on the Coronavirus Yellow Card reporting site. Conclusions on the safety and risks of the vaccines cannot be made on the data shown in the Print alone."

(繼續閱讀…)

[Python] 用TableOne畫自己的table1

Posted: 4 二月, 2021 by Nabo Ludo in Biostatistics/SAS/Python

因為要做periodically medical data review時,有preliminary lab summary能有效幫忙做signal detection和抓outlier。現在有很多web-based medical data review tools,但是遇上不同家sponsor RAVE 倒出來的dataset column都不太一樣,也很難每個案子都去做customization。

感謝現在很多Python大神開源可以無腦做summary table ,這次把try&error的過程做個筆記,也順便做個介紹。

先附上來源:

1.Github: https://github.com/tompollard/tableone

2.JAMIA (Oxford Academia): Tom J Pollard, et al. Tableone: An open source Python package for producing summary statistics for research papers. JAMIA Open, Volume 1, Issue 1, July 2018, Pages 26–31. https://doi.org/10.1093/jamiaopen/ooy012

3.練習用dataset與詳細教學: https://pypi.org/project/tableone/0.3.3/

(繼續閱讀…)

最近處理到有競爭風險 (competing risk) 的存活分析, 發現PROC LIFETEST或PROC PHREG在輸出cumulative incidence plot時, 無法在x座標軸呈現Number at risk. 不過, SAS在運算的過程, 仍然是有number at risk資訊的, 我們只要將其output, 即可做一些後製. 類似先前使用GPLOT的流程, SGPLOT可以輕易的在圖中嵌入報表; 並且, 我在y軸座標做了一個"分段"的圖示, 讓event rate不高的存活曲線不會趴在地上.

CIF

(繼續閱讀…)

[SAS] Proc Document – Copy

Posted: 7 三月, 2019 by pskeleton in Biostatistics/SAS/Python

上一篇中提到,我們可以利用 proc report 來產生報表,然後可以藉由 proc document 調整書籤的階層讓審閱者可以一目了然並找到要看的肉容。

有兩種方式可以把產出的 report 或是 table 的書籤作移動,copy 或是 move 。今天先來講 copy 的作法。

首先,我們先用 proc document 來分析最後要看到的樣式。以下是 metadata 的樣子。

圖片2

假設我們最後想看到的是,第一層為"The Report Procedure",第二層是依照 by Country 來羅列,所以 “Car Brand in Europe" 和 “Car Brand in USA" 要移到 path = \Report#1 的底下。

(繼續閱讀…)

先前有簡介過期中分析相關的試驗設計:

這邊簡單分享SAS codes, 以及不同sequential methods下, 所得到的期中/期末分析alpha值. 以Power Family (eg. ERRFUNCPOW(rho=2)) 這個method為例, nstages表示總共的分析次數 (eg. 一次期中, 期末), info裡面則輸入這兩次分析的累積資訊 (eg. 收案比例, 事件發生比例).

[註] 關於rho這個參數, 可參考SAS的說明. 當rho = 1, 會接近Pocock method的結果; 當rho = 3, 會接近O’Brien-Fleming method的結果.

proc seqdesign errspend boundaryscale=pvalue;
    TwoSidedErrorSpending: design method=ERRFUNCPOW(rho=2) 
    nstages=2 alpha=0.05 beta=0.2 
    alt=twosided stop=reject
    info=cum(0.6 1); 
run;

(繼續閱讀…)

[SAS] ODS Document

Posted: 3 九月, 2018 by pskeleton in Biostatistics/SAS/Python

利用SAS分析出統計結果後,接下來就是報告的產出。產出的報告可以有許多種樣式,如PDF、EXCEL、word (RTF),HTML…等等。最常用的就是 PDF 還有 word (RTF)。

要產出精緻的樣式和風格時,通常我們都會用 proc report 來 output 這些表格。以下為利用 proc report 來產出 PDF 的用法。非常容易就可以產出簡單的統計報表。

options nodate nonumber;
ods printer pdf file = "XXX.pdf" ;
    proc report data = dataset nowd contents = "XXX";
        title1 ;
        title3 "XXX";
    run;
ods printer pdf close;

 

然而,有時候產出的報告要讓審閱者方便閱讀,會在排版上做一些修整。這時候單是靠 proc report 是不夠的。由於每一次 proc report 執行後在 PDF 格式下的 bookmark 都會是獨立的,若要把一些相關的 report 在 bookmark 歸類在同一個項目底下時就無法單單只是靠 proc report。這時就是 ods document 出馬的時候。

(繼續閱讀…)

[SAS] 使用PROC MEANS及PROC SQL歸人

Posted: 29 八月, 2018 by Chris Lin in Biostatistics/SAS/Python

前陣子有學妹問到歸人問題, 所以在這邊分享我常用的兩種方法. 通常, 在確立研究Cohort後, 我會先建立一個初步的Analysis Dataset, 裡面可能只包含研究樣本的ID, 年齡, 及 Index Date. 接著, 再逐步擴充這個Analysis Dataset, 例如說併入 “研究樣本在Baseline期間的CCI (Charlson Comorbidity Index)”, 以及 “在研究期間的用藥compliance” 等 (如圖所示).

Analysis_Dataset

(繼續閱讀…)