生物統計
-
針對藥物動力研究中的藥物濃度時間側寫建立統計模式,藉以在第一期的臨床試驗中決定新藥的安全和有效的劑量。同樣的,根據二期雙序列交叉設計下的藥物濃度時間側寫建立統計模式,然後根據模式建立測試藥與專利藥的生物對等性檢定。
-
愛滋病相關研究、 生物指標與相對應疾病之研究、老化研究 (Aging study) 、腦學習 (Brain learning)。
-
主要包括生物醫學統計,流行病學統計分析,強韌概似推論在相關性資料,廣義線性模型上的應用。發展在不知道資料分配的情形下,有母數的強韌概似函數推論方法。
工業統計
-
工業統計是統計學在精密工業上的一種應用,一般最普遍的是產品的品質管制,而為評估產品的品質,通常需通過產品壽命測試 (life test) 試驗,以收集產品使用後的相關訊息,再使用統計方法分析數據以建立一套品質管制的規範,以期達到產品上市的要求。另一方面,為了在品質管制上能有效率且精確的掌控產品運作的情形,往往需使用統計中實驗設計的觀念,對上述測試做一評估,以達到節省成本或提高可靠度評估的精確性等特定目的。本所在工業統計方面的研究,早期著重實驗設計與田口方法(Taguchi method)等;近年則以產品可靠度分析(reliability analysis)為主。隨著科技發展,同樣產品在不同品牌下,產品可靠度已成為消費者與生產者對產品要求的重要依據。可靠度係指產品在特定條件下於既定時間內仍能使用的機率。高可靠度產品,在進行壽命測試時在正常使用狀態下,需較長時間才能觀察到失效資訊,且因製作成本較高,如欲觀察到足夠資料以檢驗產品可靠度,則將花掉太長時間與成本,因此一般會使用加速壽命試驗以縮短試驗時間。另一方面工程師或品管人員因實務經驗,往往對產品製程與品質有豐富的了解,也可對產品可靠度提供相關訊息。目前本所在可靠度方面的研究在加速壽命試驗與競爭風險之貝氏可靠度分析等。
-
在大量生產的製程中, 統計製程管制 ( Statistical Process Control, SPC ) 提供維持產品品質穩定的工具. SPC 的基本手法包含管制圖 (Shewhart 管制圖,全距管制圖,不合格品管製圖),製程能力分析 (Process capability) ,允差限界 (Tolerance limit ) 及平均連串長度 ( Average run length ) 的評估. 而更多製程監控研究方法趨向相關性資料管制圖 ( EWMA 管制圖, Copula-based 管制圖 ), 多變量管制圖及剖面監控 (Profile monitoring).
空間統計
-
空間統計為分析空間資料的統計方法,舉凡所收集的資料與位置有關均可為空間統計研究的範疇。空間統計與時間序列最大的差異在於空間中並無過去與未來的次序關係,因而不易透過某種因果關係的描述來建構空間模型,而是藉由空間中鄰近的資料通常較相距遠的資料具要較高的相似性這個性質去建立資料間的相關性,進而建構符合各類問題的空間模型,試圖從凌亂的空間資料中發掘問題背後空間變動的規律性。
-
空間統計的問題大致可分為地理統計(geostatistics)、格點空間模型(spatial lattice model)與空間點分佈型態(spatial point pattern)三大類,其應用的範圍甚廣,包含地質、天文、生態、環境監測、流行病學、影像處理…等。相關的實務與理論議題日漸豐富,有待更多有興趣的人力投入解決。
高維度資料分析
-
近年來,隨著電腦快速計算的演進,大數據時代來臨。對於大量資料帶來的許多問題, 古典的統計方法已經不夠解決了,轉而尋求新的統計方法論。考慮一個簡單的模式: 資料矩陣(data matrix) — 由伴隨d維度資訊的n個個體資料所組成。基本的研究核心就是考慮 這樣的資料矩陣,如何找到好的統計方法,在 n 和 d 各樣不同的情況下,得到估計的一致性和大樣本性質,進一步幫助統計推論。這樣的問題伴隨許多有趣且重要的研究,包括了隨機矩陣,隨機幾何,極值問題等等。
降維方法與選模問題
-
在巨量資料的時代下,降維方法與選擇正確模型和變數是重要的工作。在許多領域,包括市場營銷,金融,人工智能,機器學習,生物醫學,工業工程等等,很多有價值的研究,需要高質量的分析數據 作開發和深化。本所研究領堿涵蓋了許多方法,比如說Lasso迴歸(least absolute shrinkage and selection operator regression),稀疏迴歸(sparse regression)和貝式變數選擇法(Bayesian variable selection)等等
影像處理
-
影像辦識和資料可視化是目前本所研究重點。目前影像辨識已可實現在人臉辨識,車牌辨識,異物偵測,醫學圖像檢查等功能。高雜訊影像處理是其中的問題,高度的雜訊常常帶來假像,誤導資料科學家的判斷,例如在分子生物結構的3D重建中,大量的雜訊會誤導機器學習模式得到假式分子結構體。在極值理論中,科學家利用訊號,雜訊強度值來設計統計判別式來作為訊雜的分離。 在資料可視化方面,主成份分析(Principal Components Analysis)是一種線性降維的經典方法,而近年來t-SNE(t-distributed stochastic neighbor embedding,t-隨機鄰近嵌入法) 成為其主流。t-SNE是一種非線性的機器學習降維方法,具有降維時保持局部結構的傑出能力,由 Laurens van der Maaten 和 Geoffrey Hinton 於 2008 年提出。
財務工程與統計
-
-
衍生性金融商品定價
-
信用風險與系統風險相關研究
-
投資組合與風險控管相關理論
-
隨機分析與隨機控制於財務相關議題之應用
-
統計學習與機器學習於程式化交易之應用
-
-
時間序列研究
-
高維度資料分析
-
統合分析
金融科技
-
隨著資訊產業軟硬體技術的發展,財經資料庫收集資料的速度越來越快,所收集的資料型態也越 來越多元,如何在統計領域中的時間序列分析、高維度資料分析、與降維及選模方法等基礎下,結合數據科學領域中的分類、網絡、融合、與可視化等技術,有效地自財經資 料庫中攫取有用的資訊,以進行準確的趨勢預測與風險評估,達到有效資產配置的目的,仍待投入更多開創性的研究。