湖南科技網 湖南科技網-科技創新戰略,引領時代先鋒

李國杰:生物醫學大數據時代呼喚計算機結構師

2020-01-25 13:34 已圍觀172次 來源:湖南科技網 編輯:張馨予


 
李國杰:生物醫學大數據時代呼喚計算機結構師  
 

李國杰:生物醫學大數據時代呼喚計算機結構師

中國工程院院士 李國杰

生物醫學數據已經從PB量級的基因組測序時代進入到多組學融合的EB量級大數據時代。但是,由于生物醫學數據種類繁多、數據分散、內部結構高維復雜,大數據分析比其他領域更困難。目前生物醫學領域雖然數據量增長迅速,但成效并不十分明顯。

大數據與人工智能是一個硬幣的兩面,只有充分發揮機器學習技術的巨大潛力,才能從EB級的數據中獲得有價值的知識。生物醫學領域如果仍停留在采用字符串比對、搜索等傳統的計算機技術,就難以挖掘生物醫學大數據的潛在高價值。但要讓機器學習在生物醫學領域發揮更大的作用,需要在基礎研究方面下更大的功夫。

為機器學習奠定理論基礎的是圖靈獎得主Valiant,他提出的可能近似正確學習模型(PAC)指出,機器學習只能在一定的誤差范圍內以某種概率保證學習結果正確。因此,不同的領域機器學習的成效取決于該領域對學習誤差和泛化成功率的容忍度。

眾所周知,醫療領域與人的生命攸關,對醫療判斷失誤的容忍度很低,這就需要更高超的機器學習技術。有人戲謔目前信息領域的形勢是,軟件在吞噬世界,人工智能在吞噬軟件,深度學習在吞噬人工智能,GPU在吞噬深度學習。研究制造更高性能的GPU或類似的硬件加速器似乎成了對付大數據的主要出路。但是如果不清楚該在什么地方加速,只盲目依靠硬件的蠻力是不明智的。

在30年前上一波人工智能的高潮中,我和華云生教授在一篇綜述文章“A Survey on the Design of Multiprocessing Systems for Artificial Intelligence Applications”中指出:“設計智能系統的關鍵在于對要求解的問題的理解,而不是高效的軟件和硬件。利用基于常識、高層的元知識、更好的知識表示獲得的啟發式信息比改善計算機結構可以獲得更大的性能提高。是否用硬件實現一個給定的算法取決于問題的復雜性和該問題出現的頻率。計算機結構師的角色是選擇好的知識表示、識別開銷密集型任務、學習元知識、確定基本操作,用軟硬件支持這些任務”,這些觀點可能現在還沒有過時。

广西快乐十分现场开奖 云南11选5奖金对照表 甘肃快3助手 五分彩骗局步骤 网上捕鱼赌博坐牢吗 浙江20选5开奖公告 广西友玩麻将辅助视频 股票可以买大盘吗 血战到底麻将技巧图 捕鱼欢乐炸最新兑换码 微信红包麻将手机版