“亞楠是現(xiàn)代的具有文藝復興風格的研究者?!?/p>

加州理工學院的 Yisong Yue 教授對眭亞楠給出了頗富詩意的評價。這個通常用來描述建筑或文藝作品的形容詞放在他身上,意味著導師對其研究風格和成果的高度肯定。

過去十年中,眭亞楠一直身處機器學習、神經(jīng)工程、機器人三個前沿學科的交叉領域,通過將原創(chuàng)機器學習方法引入神經(jīng)調(diào)控技術,對癱瘓、帕金森病等神經(jīng)系統(tǒng)疾病進行臨床治療,在理論、方法、實踐三個方向均有建樹。

在 2020 年機器人與自動化國際會議(ICRA)上,他與合作者關于偏好反饋學習優(yōu)化機器人外骨骼的研究成果同時斬獲大會最佳論文獎和最佳人機交互論文獎,成為首位獲得最佳論文獎的中國大陸學者。這也是大會歷史上首次有論文同時獲得兩項大獎。

憑借在機器學習和神經(jīng)調(diào)控技術領域的基礎理論研究以及創(chuàng)新技術應用,清華大學航天航空學院助理教授眭亞楠入選了《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人” 2020 年中國區(qū)榜單。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人” 2020 年中國區(qū)榜單入選者眭亞楠

讓 AI 學習神經(jīng)調(diào)控

眭亞楠本科畢業(yè)于清華大學,曾在中國科學院神經(jīng)所研究神經(jīng)環(huán)路可塑性。在 2019 年加入清華任教之前,他先后在加州理工學院和斯坦福大學攻讀博士學位及從事博士后研究,師從 Joel Burdick 教授、Yisong Yue 教授及 Fei-Fei Li 教授。

談到返回清華的原因,他表示自己 “在留學之前就希望回國建立自己的實驗室做研究,現(xiàn)在我就在清華,是如愿以償?!?/p>

神經(jīng)調(diào)控技術,一般指利用植入或非植入技術、電或化學作用方式,刺激或改變神經(jīng)系統(tǒng)中的神經(jīng)元或神經(jīng)信號。目標人群通?;加猩窠?jīng)系統(tǒng)損傷、運動障礙、癱瘓、視覺或聽覺障礙等疾病。

眭亞楠告訴 DeepTech,神經(jīng)調(diào)控是治療此類疾病的重要方法。他長期關注脊神經(jīng)損傷導致的癱瘓,因為這個領域曾長期缺乏安全高效的治療手段。

通過植入脊髓的陣列電極,刺激感覺-運動神經(jīng)通路,是目前治療脊髓損傷導致癱瘓的最先進醫(yī)療方案。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 將刺激電極(中)植入脊髓硬膜外進行治療(來源:眭亞楠)

不過使用這些陣列電極時,還要面臨不少問題,其中核心難點是尋找最佳刺激模式。

患者的生理和病理差異,決定了每個人對電壓水平和刺激頻率的承受能力不同。而在臨床治療中,面對海量的刺激模式組合,用試錯、窮舉的實驗方法為每個患者尋找最佳方案也是不切實際的。

那能不能讓人工智能(AI)來解決這個問題?

如果把所有可能的刺激模式視作一個輸入空間,那么就可以把諸如電極、電壓、頻率一類的變量的排列組合都羅列出來,然后進行全局優(yōu)化。把這個過程抽象成函數(shù),就可以嘗試用傳統(tǒng)優(yōu)化算法找到函數(shù)的最優(yōu)解。

遺憾的是,傳統(tǒng)優(yōu)化方法在實際操作中行不通,因為普通的全局優(yōu)化策略無法顧及安全約束,尤其是未知的安全約束。

在沒有在患者身上施加刺激之前,沒人知道哪種刺激模式會奏效,同樣也沒人知道哪種刺激模式會造成傷害 —— 這就是所謂的 “未知安全約束”。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 脊神經(jīng)刺激在線臨床實驗(來源:yanansui.com)

醫(yī)生會充分考慮在施加神經(jīng)刺激的過程中保障患者安全,但傳統(tǒng) AI 方法面對未知的安全約束時,尋找最優(yōu)解的過程可能缺乏安全性。

針對這個難題,眭亞楠開發(fā)了用于控制復雜多電極刺激陣列的新型在線學習算法的理論和實踐方法,在保證算法滿足安全約束的前提下,高效尋找最優(yōu)解。這些方法還能拓展到如深部腦刺激等其他多電極問題和機器人系統(tǒng)的安全控制。

更重要的是,他的研究成果已經(jīng)成功幫助下肢癱瘓患者重新站起來,并恢復高位截癱患者手部抓握功能,是這個領域最早用于有創(chuàng)臨床治療的機器學習算法之一。

如何滿足未知的安全約束

具體來說,眭亞楠利用并融合了自己之前的兩項研究成果:面向未知安全約束的在線機器學習方法和利用偏好反饋進行在線強化學習。

第一項工作是他在加州理工學院攻讀博士時開始的,主要解決在線強化學習方法缺乏安全性保證的問題。

在探索優(yōu)化問題時,研究者通常會設立約束,但有時人們并不知道全部的約束條件。以此為前提,AI 算法需要既滿足約束條件,又要求出最優(yōu)解。

他提出的方法是首先將安全約束抽象成一個函數(shù) —— 由于安全約束條件未知,因此函數(shù)的形狀也是未知的 —— 但可以利用高斯過程作為數(shù)學工具對其建模,由此得到安全約束在數(shù)學上的顯式表達式。

在此基礎上加入一些合理的假設和初始值,比如由人類專家提供一套安全的神經(jīng)刺激模式作為初始點,然后就可以利用在線學習等 AI 算法不斷摸索并擴大安全區(qū)間,勾勒出滿足安全約束的函數(shù)的形狀。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 利用高斯過程進行安全優(yōu)化(來源:眭亞楠)

這個過程有點像打游戲,玩家在探索戰(zhàn)爭迷霧籠罩的未知區(qū)域:選擇安全的出生點之后,玩家要一點點逼近迷霧邊緣,才能開拓視野,探明地圖上哪些區(qū)域是安全的,哪些區(qū)域是不安全的,然后確保自己在安全區(qū)內(nèi)活動。

眭亞楠提出的安全在線探索理論和方法,經(jīng)過理論證明和實踐驗證,其安全性和有效性受到了肯定,并且引發(fā)了學術界和產(chǎn)業(yè)界的廣泛關注。相關成果已成為加州理工學院、斯坦福大學、卡耐基梅隆大學等頂尖高校的本科課程和教材內(nèi)容。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 入選頂尖高校教材的 SafeOpt 算法(來源:yanansui.com)

處理非量化信息的偏好反饋

利用偏好反饋進行在線強化學習,則是從 AI 算法難以處理非量化信息的角度切入。相關研究成果不僅用于脊髓電刺激治療上,還能用于外骨骼機器人控制優(yōu)化上。

以外骨骼機器人為例,它的參數(shù)包括重量、尺寸、步態(tài)、跨步長度、關節(jié)靈敏度等等。通過改變這些參數(shù),研究者可以在一定程度上調(diào)節(jié)使用者的舒適度,比如盡量減少消耗的能量,使其走起路來更輕松。

但在實際應用中,使用者的反饋通常是 “不舒服”,“現(xiàn)在感覺不錯”,或者 “更喜歡上一種控制模式”,這些都是不易量化的信息。

“每個人的偏好是不同的。即使是客觀的量化指標,比如代謝率、呼吸頻率、心率等等,它們和使用者的偏好之間的關聯(lián)度也不太強,沒辦法準確描述使用者的偏好,” 眭亞楠解釋道。

針對這個問題,他將偏好反饋構建成一個對弈過程的勝負結果,通過構建自博弈機制,可以靈活處理結構化與非結構化的輸入,并且從理論上證明了漸進最優(yōu)的收斂性。

通過對偏好反饋的有效收集和利用,外骨骼機器人可以快速且自動地適應每個用戶,實現(xiàn)控制方案的優(yōu)化。

也就是關于這項研究的論文,最終斬獲 2020 年機器人與自動化國際會議(ICRA)大會最佳論文獎和最佳人機交互論文獎。

應用廣泛,科技向善

如文章開頭所說,眭亞楠的研究方向正處于機器學習、神經(jīng)工程、機器人三個前沿學科的交叉領域,其研究成果有著十分廣泛的應用場景。

譬如在醫(yī)學領域,可以改善癱瘓、帕金森病等神經(jīng)系統(tǒng)疾病的臨床治療效果,讓患者重新恢復運動能力,還能拓展到如深部腦刺激等其他多電極問題。而在機器人和航空航天領域,可以用于外骨骼機器人,無人機飛行器,甚至是火星車上,實現(xiàn)更高效地控制參數(shù)優(yōu)化以及安全操控。

目前,除了持續(xù)拓展上述科研項目,眭亞楠還啟動了有關醫(yī)療數(shù)據(jù)隱私保護的新課題,專注于解決醫(yī)學人工智能領域的現(xiàn)實挑戰(zhàn)。

用于醫(yī)學研究的數(shù)據(jù)共享一直是業(yè)界難題,如果操作不當,開源臨床數(shù)據(jù)很可能會泄露患者的隱私。

相較于醫(yī)學影像等數(shù)據(jù),有關運動障礙或者交互行為的視頻資料更難處理。雖然可以打上馬賽克,但會影響后續(xù)的分析工作。

眭亞楠另辟蹊徑,選擇了 Deepfake 作為患者隱私保護的工具。這是一種可以替換視頻中人臉的技術,但因被用于制造假視頻而受到廣泛批評。

這并不妨礙技術本身的價值。他的研究表明,利用 Deepfake 技術,醫(yī)療視頻中患者的臉部可以被替換為適當?shù)哪繕四槻浚Wo患者面部隱私,同時保留所需的互動信息(例如面部表情)供研究人員分析和診斷。

清華學者讓AI學習神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 用 Deepfake 實現(xiàn)患者視頻隱私保護:左圖是換臉之前,右圖是換臉之后(來源:眭亞楠)

這是一個很好的科技向善的應用案例:技術作惡還是從善,很大程度上取決于人們?nèi)绾问褂盟?/p>

清華大學航天航空學院院長李路明教授認為,眭亞楠獨特而新穎的嘗試使得 “開源高質(zhì)量的醫(yī)學視頻數(shù)據(jù)集更加可行,并且促進了有益于整個社會的未來醫(yī)學研究?!?/p>

相關成果發(fā)表于人工智能倫理學研究領域的領先會議 AIES 上,是第一篇被 AIES 接收的中國論文,也受到?Science?雜志的關注和報道。

談及未來,眭亞楠表示將繼續(xù)帶領研究組從事機器學習、機器人學和神經(jīng)調(diào)控的基礎研究,推動患者隱私保護和在此基礎上的醫(yī)學人工智能研究。他還將繼續(xù)與醫(yī)院合作進行臨床轉化研究,服務更多患者。

“我希望以人工智能為代表的先進計算技術能做到更多人類做不到的事情,而非人類擅長的事情,”他強調(diào),“隨著相關技術的進步,人類在智能層面將面臨越來越多的挑戰(zhàn)。作為研究者,我們應該有更強的責任意識,要從超越技術的角度看待 AI 的發(fā)展?!?/p>

來源:麻省理工科技評論