關于舉辦天津市現場統計研究會2020年學術年會的通知
題目:高比例缺失的數據分析
主講人:林華珍等11人
時間:2020年12月12日全天
地點:H213
講座內容:對于實際問題,我們在數據收集過程中會面臨一些不可控因素,這使得收集的數據常常有大規模缺失問題。我們將針對兩種典型的大規模缺失數據:協變量缺失和結果變量缺失數據,分別設計相應的處理缺失的方法,并建立估計的理論性質。特別,針對大規模協變量缺失問題,比如一個在線小額信貸數據有93%的貸款用戶都有缺失值,并且每個用戶的缺失模式各不相同,我們提出了一種簡單而有效的迭代最小二乘估計量。我們的方法不需要對協變量進行任何建模假設,而且由于利用了數據結構信息,估計結果有某種超有效特點;針對結果變量缺失問題,我們結合概率指標模型提出一個新的Mann-Whitney統計量來評估兩組人群不匹配情況下的治療或策略效果。我們提出的方法在理論上具有有效性和穩健性,并且能在少量樣本下得到精確估計和給出統計推斷。
主辦單位:天津財經大學統計學院
歡迎廣大師生踴躍參加!