网上彩票开户

400-050-6600

高致病性禽流感H5N1病毒在職業人群感染的數據研究

LAIYUAN:BEIJINGZHONGHUIZHICHENGSHUJUFENXISHISHIWUSUO SHIJINGHONG / ZUOZHE: / SHIJIAN:2019-12-16

首先我和大家簡單介紹一下我的背景,我在北京中輝智誠數據分析師事務所從事數據研究工作,具有醫學背景,專業是流病與統計,我們這個專業主要從事的就是醫藥衛生方面的項目研究、數據分析、疾病控制等等。我現在將與大家分享的一個項目,是我們曾經做的一個調查研究的項目。通過分享,我希望可以達到一個目的:就是對衛生健康領域方面的研究的某個方面有個初步了解。


首先說一下我們這個項目的背景。2003年年底—2013年年初,高致病性禽流感H5N1感染人類,在中國的病死率是68%,發病時間多集中在冬春季,大多數病例有直接或者間接接觸病死禽的暴露史。在中國禽類養殖的這些職業人群中,他們感染高致病性禽流感的情況研究尚少,我們想了解高致病性禽流感H5N1病毒在職業人群的感染情況,以及家鴨感染高致病性H5N1病毒的情況。


為了達到這個目的,我們是怎么做的呢?通過什么方法解決這個問題呢?通過現況調查研究,根據我們的研究目的,我們查閱了大量文獻,組織專家研討會,制定調研方案等。這里,重點說一下數據獲取和分析部分。


一、數據獲取和處理

1、調查問卷

數據獲取有多種方式,譬如互聯網現在比較流行的八爪魚抓取,或者查閱統計年鑒。我們這個項目用的數據獲取辦法是調查問卷。根據我們的項目目的,我們設計了2份調查問卷,一份是針對養殖人員的,包括基本信息、病死家禽接觸史、病死野禽接觸史、接種疫苗等情況,另一份是針對養殖戶的,包括基本信息、養殖方式、死禽等信息的獲取。在設計調查問卷的時候,注意編碼的唯一性,這就像我們的身份證號一樣,我們都用的是打印的條形碼,有號碼可以掃也有數字可以錄入。關聯幾個數據庫利用的就是編碼的唯一性。


2、調研安排




3、數據處理

調查問卷數據錄入:利用epidate建立數據模型,在建庫的時候就設置一些邏輯判斷,然后錄入數據,同時所有數據進行雙錄入,進行一致性檢驗,質控。導出excel格式,備用。


標本數據錄入:因為數據格式比較簡單,所以我們就利用excel建立數據模板,錄入數據,抽查進行質控,備用。


調查問卷的數據庫與標本數據庫關聯:利用血清標本條形碼是唯一的且兩個數據庫均有,進行數據庫關聯。


數據清洗:

1)數據篩選:在我們的調查問卷中,第一個問題被調查者調查時工作或者生活是否至少2周?如果是,我們經過篩選就納入進來,作為我們的準備分析的數據。


2)數據缺失值處理:我們通常有四種方法:第一種是通過被調查者電話進行回訪,補充缺失數據。第二種刪除缺失值個案、但是這種方法會導致樣本量減少,以及樣本結果發生變化。第三種,保留缺失值個案,僅在相應的分析中進行必要的排除。第四種,是用統計值來代替缺失值,如平均值、或者前后平均值,這種方法適用于數值型數據。至于選擇用平均值還是前后平均值,這個要根據具體變量的特點,不一定就是前后均值優于平均值,譬如年齡,可能用整體平均值更適合,如果用前后平均值可能代表性要差異性。



二、數據分析

    利用不同的統計方法,從以下幾個方面分析數據:

1、整體情況,如年齡、性別、學歷等信息。

2、暴露史:接觸病死家禽、接觸病死野禽情況等。

3、發熱情況

4、接種疫苗情況:流感疫情、其他疫苗

5、感染情況(陽性率)

6、環境標本中檢出H5N1病毒。養殖人員未檢出H5N1病毒。

7、風險因素分析


三、得出結論

禽類暴露人群感染高致病性禽流感H5N1的感染率很低。從家鴨分離的禽流感病毒有可能傳播給野禽,也很可能擴散到其他陸地家禽。完成整個項目,對于數據分析有幾點體會:


1、如何解決問題?保持勿驕勿躁、沉穩有序的心態,心急手穩,查閱資料,撰寫研究方案。

2、數據分析作為整個項目的一部分工作,是服務于項目的。

3、數據質量是保障數據分析準確完美的關鍵基礎。

對于我們數據分析師來說,數據質量是至關重要的,因為不同數據質量導致不同的結果。在調研過程中,加強培訓、及時溝通、態度認真,是保障數據質量的關鍵。

4、數據分析方法的選擇,基于我們的項目需求,根據項目需求,利用excel制作簡單圖表更加快捷美觀,利用SPSS進行統計分析。我認為,選擇什么統計工具都沒有關系,只要熟練運用就可以,不要在選擇方法或者設定操作的時候出現錯誤就可以。數據分析過程中,除了本身計劃的設計分析,有時也可以大開腦洞,也許會有意外收獲。即使現在是大數據時代,但對于常用的統計方法來說,沒有太大變化。原來我還拿過SASSPSSexcel做過同一批數據,結果沒有什么太大差別。

5、最后一點,不同領域方法是相通的,不要擔心沒有涉獵的領域,我們就不能做。但是,也一定要注意:在進行數據分析的時候,一定要詳細了解本行業領域的背景資料,這樣才會更好的出具數據分析報告。


另外,我個人認為,隨著大數據行業的發展,數據量足夠大的時候,我們可能不在考慮什么影響因素,可能更多的關注更多的是趨勢和預測未來。

Prev article

网上彩票开户KONGDIAOJIZUBAOJIAYUCE——JIYUXIANXINGHUIGUIDESHUJUFENXIANLI

Next article

YONGPythonYUYANZUOSHUJUFENXIJIBENSILUHELIUCHENG

KECHENGFUWU

RENZHENGFUWU