重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO
隨著高通量生物技術的發(fā)展,已經開發(fā)了多種組學技術來表征不同但互補的生物信息,包括基因組學、微生物組學、轉錄組學、和代謝組學等單細胞測序 (scSeq) 因其在單個細胞中測序 DNA 和 RNA 的能力而被選為 2013 年的年度方法,近年來深度測序技術快速發(fā)展,使得在單個細胞尺度檢測基因表達和染色質開放性成為可能,形成了單細胞多組學數據整合分析的研究熱點。單細胞數據往往呈現超高維度、極度稀疏等特點,這對下游生物信息分析提出了極大挑戰(zhàn)。而已有分析方法大都缺乏對高維數據分析的理論依據,較難克服上述單細胞數據分析的難點,深度學習模型在理解復雜病理表型(如癌癥、耐藥性和神經生物學)方面的生物學泛化性和可解釋性對于組學領域具有極大的興趣和重要性。深度學習幾乎顛覆了每一個研究領域,包括那些對藥物發(fā)現有直接重要性的領域,如藥物化學和藥理學,CADD應用中的DL已經取得了重大進展,如虛擬篩選、新藥設計、吸收、分布、代謝、排泄和毒性 (ADMET) 特性預測等等。
蛋白質晶體結構解析:近年來結構生物學發(fā)展迅速并和其他學科相互滲透交叉,特別是受到結構基因組學等熱點學科的極大帶動。作為結構生物學的基本手段和技術,蛋白質晶體學從解析簡單的蛋白質三維結構延伸到解決各類生物大分子及復合物結構,并更加注重研究結構與功能之間的相互關系
現如今生命科學領域最火的技術之一便是基因編輯,基因編輯領域又屬CRISPR系統(tǒng)應用最為廣泛,《Nature》2017 年度人物均授予了 CRISPR 相關技術的突破,2020年CRISPR技術獲得諾貝獎,短短不到十年時間CRISPR技術榮獲最高學術榮譽,足以看出該技術的應用潛力。??基因編輯技術廣泛應用于人、大鼠、小鼠、斑馬魚、果蠅、豬、水稻、小麥和擬南芥等動植物(細胞)以及細菌等微生物的基因組靶向改造,并已在功能基因組研究、疾病防治、動植物育種、動物疾病模型開發(fā)

下面是近兩年在頂刊發(fā)表的部分研究方向

  • Nature Protocols |?基于機器學習和并行計算的代謝組學數據處理新方法
  • Nature|?基于機器學習的血清代謝組學開發(fā)生物標志物用早期肺腺癌篩查
  • ISME Comm|機器學習和深度學習在微生物組研究中的應用
  • Nature Biotechnology自動化和機器學習的高通量微生物培養(yǎng)組學分離微生物組
  • Cancer Cell |?基于多模態(tài)深度學習的泛癌組織學-基因組學整合分析
  • Science Advances|利用深度學習發(fā)現癌癥中的新基因突變
  • Nature|腫瘤微環(huán)境的多組學機器學習預測乳腺癌治療反應
  • Nature|肺癌和轉移瘤中的基因組-轉錄組進化
  • Nature Machine Intelligence|單細胞數據分析的深度學習方法
  • Nature Methods |?用深度多任務神經網絡探索單細胞數據
  • JCIM|利用深度學習進行基于結構的從頭藥物設計
  • Journal of Medicinal Chemistry報道基于靶標結構的深度學習全新藥物設計方法
  • Nature Reviews綜述?|?機器學習在藥物發(fā)現和開發(fā)的應用
  • Science Advances |?實現了對較小的膜蛋白晶體結構解析方法的研究突破
  • Nature:一種基于CRISPR/Cas9的非病毒精準基因組編輯臨床級療法
人工智能與組學和藥物設計以及基因編輯技術和蛋白質晶體結構解析的研究到底有多熱,以及為何要舉辦培訓,下面的內容給出了答案
近兩年國內外頂尖課題組MIT、Harvard University、UPenn、清華大學、復旦大學、西湖大學等都在從事人工智能與組學與藥物和基因編輯技術以及蛋白質晶體結構解析的研究,這一研究成果更是多次發(fā)表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology等知名國際頂刊上,為我們發(fā)表頂刊鑒定了基礎由于該項研究資料和學習平臺較少,信息技術不公開,培訓學習迫在眉睫,特此誠摯邀請您參加線上培訓課,參會會員已達3000余名!助力學員發(fā)表Nature、Science、Cell等正刊及子刊?。ㄔ谛录夹g加持下,用更少的經費,發(fā)更高質量的文章)

九大培訓主題助力您發(fā)頂刊

MONDAY

專題一、CRISPR-Cas9基因編輯技術

專題二、蛋白質晶體結構解析

專題三、深度學習基因組學

專題四、機器學習代謝組學

專題五、機器學習轉錄組學與表觀組學

MONDAY

專題六、深度學習單細胞分析

專題七、機器學習微生物組學

專題八、CADD計算機輔助藥物設計

專題九、AIDD人工智能藥物發(fā)現與設計

專題一、CRISPR-Cas9基因編輯技術專題

第一天

一. 基因編輯工具介紹

1. 基因編輯和轉基因是一樣的嗎?

2. 生活中的基因編輯與轉基因產品

3. 基因編輯工具先驅-ZFNs和TALENs

4. 沒落的ZFNs和TALENs

5. TALENs,舊工具新用,細胞器編輯利器!

6. 強勢崛起的CRISPR系統(tǒng)

7. CRISPR系統(tǒng)家族介紹

8. CRISPR-Cas9的工作原理

9. CRISPR-Cas12的工作原理

10. CRISPR系統(tǒng)的致命缺點

11. 如何選擇合適的CRISPR系統(tǒng)?

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

第二至三天

二. CRISPR系統(tǒng)可以做什么?

1. 基因敲除/基因敲入

i. 基因修復途徑介紹(NHEJ和HDR)

ii. Knock-in和Knock-out的簡介

iii. Knock-in策略簡介(HDR/Retron/雙pegRNA策略/GRAND/TJ-PE)

2. 多敲系統(tǒng)簡介

3. CRISPRa/CRISPRi(基因激活與基因抑制)

i. dCas9-PVPR系統(tǒng)介紹

ii. dCas9-VP64/GI/SAM基因激活系統(tǒng)介紹

iii. 基因編輯招募系統(tǒng)介紹(Suntag/Moontag)

4. CRISPR系統(tǒng)的‘另類’應用(循環(huán)打靶)

5. CBE系統(tǒng)的原理及其應用

i. CBE系統(tǒng)進化過程總結(CBEmax/每代優(yōu)化的元件及策略匯總)

ii. 基因組CBE編輯(植物育種/基因功能研究/臨床治療)

iii. 細胞器CBE編輯工具介紹(Ddda脫氨酶/MutH切口酶)

iv. CBE系統(tǒng)的脫靶效應

6. ABE系統(tǒng)的原理及其應用

i. PACE和PANCE人工定向蛋白進化系統(tǒng)介紹及其他常規(guī)的蛋白進化技術

ii. ABE系統(tǒng)的進化過程總結(ABEmax/ABE8e每代優(yōu)化的元件及策略匯總)

iii. ABE系統(tǒng)的‘另類’應用(基因失活/跳剪/介導C編輯)

iv. 雙堿基編輯系統(tǒng)(SWISS/STEME/A&C-BEmax/SPACE/ACBE)

7. PE系統(tǒng)的原理及其應用

i. PE介導精準編輯

ii. 編輯效率的影響因素(骨架二級結構/PBS長度/RTT模板)

iii. 雙pegRNA的原理及其應用(基因組大片段插入)

iv. 基因組大片段刪除

v. 用于AAV遞送的PE系統(tǒng)

8. gGBE的原理及其應用

i. 糖基化酶介紹(為什么可以介導堿基編輯?)

ii. gGBE的開發(fā)與應用

iii. gGBE的后續(xù)發(fā)展預測

9. CRISPR-Case12的病毒檢測應用

i. 原理介紹

ii. 應用案例介紹

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

第四天

三. CRISPR載體構建(實操)

1. 敲除/堿基編輯載體構建

i. 工具介紹

ii. 如何查看質粒圖譜

iii. 基因靶點的選擇(CRISPR-GE等線上工具展示)

iv. sgRNA的引物設計

v. 模擬構建(酶切載體/構建體系講解)

vi. 菌落PCR

vii. 測序鑒定結果分析

2. PE系統(tǒng)的載體構建

i. 引物設計工具的應用

ii. 載體構建演示

iii. 測序結果分析

3. 轉染陽性檢測

4. 測序原理及結果查看

i. 一代測序原理

ii. Hi-TOM高通量測序

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

第五天

四. 基因編輯在植物種的應用

1. 基因功能研究

2. 創(chuàng)制新品種

五. 基因編輯在臨床上的應用

1. 堿基編輯的臨床應用

2. PE系統(tǒng)的臨床應用

3. 遞送系統(tǒng)的介紹

六. 基因編輯在微生物中的應用

1. 微生物遺傳學研究

2. 生物技術(可產生生物燃料/生物塑料/藥物等有用的化合物)

七. 機器學習在基因編輯領域的應用

1. 基因編輯結果的預測

2. 編輯效率影響因素的探索

3.基因編輯輔助工具的開發(fā)

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題二、蛋白質晶體結構解析專題

第一天

蛋白質結晶前準備

1. 目的蛋白質信息檢索(包括實操演示)

1.1 不同種屬的蛋白

1.2 蛋白質一級結構的調查

1.3 蛋白質三級結構的預測

1.4 蛋白質理化特性的預測

1.5 蛋白質的配體和共價修飾

2. 分子克隆技術

2.1 目的基因的獲?。ò▽嵅傺菔荆?/p>

2.2 目的基因的引物設計(包括實操演示)

2.3 傳統(tǒng)克隆技術(涉及學習SnapGene軟件,包括實操演示)

2.4 無縫克隆技術(涉及學習SnapGene軟件,包括實操演示)

以某一基因進行操作演示

3. 利用大腸桿菌表達目的蛋白

3.1 目的蛋白的小量鑒定表達

3.2 目的蛋白的大量表達

3.3 收菌和裂解菌體

3.4 裂解液的離心

3.5 目的蛋白的濃縮

3.6 目的蛋白濃度的測定

4. 真核表達系統(tǒng)

第二天

蛋白質結晶準備

1.蛋白晶體結構的特征

1.1蛋白晶體的空間格子、晶胞和晶面指標

1.2蛋白晶體的對稱性、點群、晶系和空間群

2. 蛋白質晶體生長的理論知識(詳細講解溫度、pH值、離子強度、有機溶劑、沉淀劑,等等,對蛋白晶體生長的影響;影響蛋白質晶型的因素)

3. 蛋白質晶體生長條件的初篩(詳細講解晶體初篩的注意事項)

4. 蛋白質晶體生長條件的優(yōu)化 (詳細講解晶體優(yōu)化的方法,包括改變pH值、沉淀劑,等因素)

5. 晶種法優(yōu)化蛋白質晶體生長條件

6. 蛋白晶體的挑選和防凍液的配制

第三天

蛋白晶體衍射數據收集

1.X射線衍射

1.1. X射線衍射原理

1.2. X射線衍射的電子密度

1.3. 晶體結構解析的相角問題

2. 上海光源線站BL18U1、BL19U1和BL02U1收集數據的方法 (重點詳細講解,可能需要更長的時間)

3. 蛋白晶體結構解析軟件的安裝(包括Ubuntu系統(tǒng)、Phenix軟件、CCP4軟件、PyMoL軟件、XDS軟件和Adxv軟件)

第四天

蛋白晶體結構解析

  1. 1.?晶體結構的解析
  2. 1.1. 晶體結構解析流程
  3. 1.2. Index、Intergrate和Scale
  4. 1.3. 分子置換技術(包括實操演示)
  5. 1.4. 蛋白晶體結構的重建(包括實操演示)
  6. 1.5. 蛋白晶體結構的優(yōu)化(包括實操演示)
  7. 2. 晶體結構的精修(涉及COOT軟件、Phenix軟件和CCP4軟件,包括實操演示)
  8. 3. 晶體結構質量的評價指標(詳細講解各個評價指標)
  9. 4. 蛋白質結構中加入小分子配體
  10. 5. 在結構解析過程中,如何利用軟件提高分辨率(重點講解,需要較長的時間)

第五天

蛋白晶體結構的提交及展示

1.?從晶體生長到解析,詳細剖析提高分辨率的方法(包括示例演示)

2.?蛋白晶體結構數據提交到PDB(包括實操演示)

3. 蛋白晶體結構的展示(包括實操演示)

DANCEING……

專題三、深度學習基因組學

第一天

理論部分

深度學習算法介紹

1.有監(jiān)督學習的神經網絡算法

1.1全連接深度神經網絡DNN在基因組學中的應用舉例

1.2卷積神經網絡CNN在基因組學中的應用舉例

1.3循環(huán)神經網絡RNN在基因組學中的應用舉例

1.4圖卷積神經網絡GCN在基因組學中的應用舉例

2.無監(jiān)督的神經網絡算法

2.1自動編碼器AE在基因組學中的應用舉例

2.2生成對抗網絡GAN在基因組學中的應用舉例

實操內容

1.Linux操作系統(tǒng)

1.1常用的Linux命令

1.2 Vim編輯器

1.3基因組數據文件管理,?修改文件權限

1.4查看探索基因組區(qū)域

2.Python語言基礎

2.1.Python包安裝和環(huán)境搭建

2.2.常見的數據結構和數據類型

第二天

理論部分

基因組學基礎

1.基因組數據庫

2.表觀基因組

3.轉錄基因組

4.蛋白質組

5.功能基因組

實操內容

基因組常用深度學習框架

1.安裝并介紹深度學習工具包tensorflow, keras,pytorch

2.在工具包中識別深度學習模型要素

2.1.數據表示

2.2.張量運算

2.3.神經網絡中的“層”

2.4.由層構成的模型

2.5.損失函數與優(yōu)化器

2.6.數據集分割

2.7.過擬合與欠擬合

3.基因組數據處理

3.1安裝并使用keras_dna處理各種基因序列數據如BED、?GFF、GTFBIGWIG、BEDGRAPH、WIG

3.2使用keras_dna設計深度學習模型

3.3使用keras_dna分割訓練集、測試集

3.4使用keras_dna選取特定染色體的基因序列等

4.深度神經網絡DNN在識別基序特征中應用

4.1實現單層單過濾器DNN識別基序

4.2實現多層單過濾器DNN識別基序

4.3實現多層多過濾器DNN識別基序

第三天

理論部分

卷積神經網絡CNN在基因調控預測中的應用

1.Chip-Seq中識別基序特征G4,如DeepG4

2.Chip-Seq中預測DNA甲基化,DeepSEA

3.Chip-Seq中預測轉錄調控因子結合,DeepSEA

4.DNase-seq中預測染色體親和性,Basset

5.DNase-seq中預測基因表達eQTL,Enformer

實操內容

復現卷積神經網絡CNN識別基序特征DeepG4、非編碼基因突變DeepSEA,預測染色體親和性Basset,基因表達eQTL

1.復現DeepG4Chip-Seq中識別G4特征

2.安裝selene_sdk,復現DeepSEAChip-Seq中預測DNA甲基化,非編碼基因突變

3.復現Basset,從Chip-Seq中預測染色體親和性

4.復現Enformer,從Chip-Seq中預測基因表達eQTL

第四天

理論部分

深度學習在識別拷貝數變異DeepCNV、調控因子DeepFactor上的應用

1.SNP微陣列中預測拷貝數變異CNV,DeepCNV

2.RNA-Seq中預測premiRNA,dnnMiRPre

3.從蛋白序列中預測調控因子蛋白質,DeepFactor

實操內容

1.復現DeepCNV利用SNP微陣列聯合圖像分析識別拷貝數變異

2.復現循環(huán)神經網絡RNN工具?dnnMiRPre,從RNA-Seq中預測premiRNA

3.復現DeepFactor,從蛋白序列中識別轉錄調控因子蛋白質

第五天

理論部分

深度學習在識別及疾病表型及生物標志物上的應用

1.從基因表達數據中識別乳腺癌分型的深度學習工具DeepType

2.從高維多組學數據中識別疾病表型,XOmiVAE

3.基因序列及蛋白質相互作用網絡中識別關鍵基因的深度學習工具DeepHE

實操內容

1.復現DeepType,從METABRIC乳腺癌數據中區(qū)分乳腺癌亞型

2.復現XOmiVAE,從TCGA多維數據庫中識別乳腺癌亞型

3.復現DeepHE利用基因序列及蛋白質相互作用網絡識別關鍵基因

第六天

理論部分

深度學習在預測藥物反應機制上的應用

1.聯合腫瘤基因標記及藥物分子結構預測藥物反應機制的深度學習工具SWnet

實操內容

1.預處理藥物分子結構信息

2.計算藥物相似性

3.在不同數據集上構建self-attention SWnet

4.評估self-attention SWnet

5.構建多任務的SWnet

6.構建單層SWnet

7.構建帶權值層的SWnet

案例圖片:

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題四、機器學習代謝組學

第一天

A1?代謝物及代謝組學的發(fā)展與應用

1) 代謝生理功能;

2) 代謝疾??;

3) 非靶向與靶向代謝組學;

4) 空間代謝組學與質譜成像(MSI);

5) 代謝流與機制研究;

6) 代謝組學與藥物和生物標志物。

A2?代謝組學實驗流程簡介

A3?色譜、質譜硬件原理

1) 色譜分析原理;

2) 色譜的氣相、液相和固相;

3) 色譜儀和色譜柱的選擇;

4) 質譜分析原理及動畫演示;

5) 正、負離子電離模式;

6) 色譜質譜聯用技術;

7?LC-MS?的液相系統(tǒng)

A4?代謝通路及代謝數據庫

1) 幾種經典代謝通路簡介;

2) 能量代謝通路;

3) 三大常見代謝物庫:HMDB、METLIN??KEGG;

4) 代謝組學原始數據庫:Metabolomics Workbench?Metabolights.

第二天

B1?代謝物樣本處理與抽提

1)組織、血液和體液樣本的提取流程與注意事項;

2)用?ACN?抽提代謝物的流程與注意事項;

3)樣本及代謝物的運輸與保存問題;

B2 LC-MS數據質控與搜庫

1LC-MS?實驗過程中?QC?樣本的設置方法;

2LC-MS?上機過程的數據質控監(jiān)測和分析;

3XCMS?軟件數據轉換與提峰;

B3 R軟件基礎

1R??Rstudio?的安裝;

2Rstudio?的界面配置;

3R?的基本數據結構和語法;

4)下載與加載包;

5)函數調用和?debug;

B4 ggplot2

1)安裝并使用?ggplot2

2ggplot2?的畫圖哲學;

3ggplot2?的配色系統(tǒng);

4ggplot2?畫組合圖和火山圖;

第三天

機器學習

C1無監(jiān)督式機器學習在代謝組學數據處理中的應用

1)大數據處理中的降維;

2PCA?分析作圖;

3)三種常見的聚類分析:K-means、層次分析與?SOM

4)熱圖和?hcluster?圖的?R?語言實現;

C2一組代謝組學數據的降維與聚類分析的?R?演練

(1)數據解析;

(2)演練與操作;

C3有監(jiān)督式機器學習在代謝組學數據處理中的應用

1)數據用?PCA?降維處理后仍然無法找到差異怎么辦?

2PLS-DA?找出最可能影響差異的代謝物;

3VIP score??coef?的意義及選擇;

4)分類算法:支持向量機,隨機森林

C4一組代謝組學數據的分類算法實現的?R?演練

(1)數據解讀;

(2)演練與操作;

第四天

D1?代謝組學數據清洗與?R?語言進階

1)代謝組學中的?tfold-change?和響應值;

2)數據清洗流程;

3R?語言?tidyverse

4R?語言正則表達式;

5)代謝組學數據過濾;

6)代謝組學數據?Scaling?原理與?R?實現;

7)代謝組學數據的?Normalization;

8)代謝組學數據清洗演練;

D2在線代謝組分析網頁?Metaboanalyst?操作

1)用?R?將數據清洗成網頁需要的格式;

2)獨立組、配對組和多組的數據格式問題;

3Metaboanalyst??pipeline?和注意事項;

4Metaboanalyst?的結果查看和導出;

5Metaboanalyst?的數據編輯;

6)全流程演練與操作

第五天

E1機器學習與代謝組學頂刊解讀(2-3?篇);

1Nature Communication?一篇代謝組學小鼠腦組織樣本?database?類型的文獻;

2Cell?一篇代謝組學患者血液樣本的機器學習與疾病判斷的文獻;

31-2?篇代謝組學與轉錄組學和蛋白組學結合的文獻。

E2?文獻數據分析部分復現(1?篇)

1)文獻深度解讀;

2)實操:從原始數據下載到圖片復現;

3?學員實操。

案例圖片:

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題五、機器學習轉錄組學與表觀組學

第一天

理論部分

高通量測序原理

高通量測序基礎

測序方法及數據

二代測序數據分析流程

實操內容

R語言基礎

R(4.1.3)和Rstudio的安裝

R包安裝和環(huán)境搭建

數據結構和數據類型

R語言基本函數

數據下載

數據讀入與輸出

第二天

理論部分

多組學基礎

常用生物組學實驗與分析方法

常用組學數據庫介紹

批量處理組學數據

生物功能分析

基于轉錄組學的差異基因篩選,疾病預測

組學數據可視化

實操內容

Linux操作系統(tǒng)

Linux操作系統(tǒng)的安裝與設置

網絡配置與服務進程管理

Linux的遠程登錄管理

常用的Linux命令

在Linux下獲取基因數據

利用Linux探索基因組區(qū)域

Shell script與Vim編輯器

基因組文件下載與上傳

Linux權限管理

文件的身份

修改文件的所有者和所屬組

修改文件權限

第三天

理論部分

介紹轉錄組學的基本概念和研究流程

RNA-seq數據的預處理和質量控制

序列比對和對齊評估

基因表達量估計和差異表達分析

實操內容

轉錄組測序數據質量控制

轉錄組數據比對

RNA-seq數據原始定量

主成分分析

原始定量結果差異分析

差異結果篩選及可視化

GO和KEGG通路富集分析

GSEA基因集富集分析

第四天

理論部分

表觀遺傳學的基本概念和技術介紹

DNA甲基化和組蛋白修飾的分析方法

表觀組數據的預處理和質量控制

差異甲基化和差異修飾分析

甲基化和修飾的功能注釋和富集分析

甲基化數據的整合分析和基因調控網絡構建

表觀組數據的可視化方法和工具

介紹其他表觀組學技術(如染色質構象捕獲)

實操內容

測序數據質量控制和檢查

數據比對和多匹配問題

計算結合峰位置

IGV中組學結果可視化

差異peaks分析

結合程度矩陣計算

富集熱圖和曲線圖繪制

第五天

理論部分

機器學習概述

線性模型

決策樹

支持向量機

集成學習

模型選擇與性能優(yōu)化

實操內容

決策樹算法實現

隨機森林算法實現

支持向量機(SVM)算法實現

樸素貝葉斯算法實現

Xgboost算法實現

聚類算法實現

DBSCAN算法實現

層次聚類算法實現

第六天

理論部分

基因功能注釋和富集分析

WGCNA(Weighted Gene Co-expression Network Analysis)網絡分析

轉錄因子分析和調控網絡構建

轉錄組數據的可視化方法和工具

轉錄水平預測蛋白翻譯水平

實操內容

創(chuàng)建Seurat對象

數據質控

測序深度差異及標準化

單細胞數據降維

批次效應去除

數據整合

亞群注釋

GSVA通路活性分析

單細胞富集分析

案例圖片:

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題六、深度學習單細胞分析

第一天

理論內容

1.單細胞組學研究簡介(包含單細胞轉錄組測序技術進展及其原?)

2.單細胞主要數據庫介紹

2.1 CellMarker

2.2 CancerSEA

2.3 Tabula Muris

2.4 TISCH

3.單細組學在腫瘤、發(fā)育、免疫及其它領域的研究思路的介紹?4.單細胞測序分析在科研中的應用

4.1?bulk?測序相較的優(yōu)勢

4.2?發(fā)現新細胞類型

4.3?識別細胞亞群的轉錄差異

4.4?細胞互作預測

內容

1.R語言基礎

1.1?文件讀入

1.2?數值、字符串、向量

1.3?列表?矩陣數據框

2.數據清洗

2.1缺失值處理

2.2數據篩選

2.3數據合并

2.4數據匹配

2.5分類變量

2.6條件函數

2.7?字符串的切分

2.8重復值處理

3.R?語言基礎繪圖

3.1?箱式圖

3.2小提琴圖

3.3?熱圖

第二天

理論內容

1.Seurat對象

2.細胞質控

2.1 nFeature

2.2 nCount

2.3 percent.mt

3.特征選擇

3.1高變基因

3.2 FindVariableFeatures

4.降維聚類

4.1 tsne

4.2 umap

4.3?線性降維?PCA

內容

1.數據讀入

1.1 10x?數據讀入

1.2 csv?數據讀入

1.3 txt?數據讀入

2.?多數據的整合

2.1直接法

2.2?harmony

3.質控

4.歸一化

5.聚類

6.tSNE/UMAP降維

7.細胞類型注釋

7.1自動注釋法

7.2?marker人工注釋法

8.細胞比例計算

9.基因集打分

9.1 ssGSEA

9.2 AUCell

10.單細胞?GSVA富集分析

11.單細胞GSEA富集分析

第三天

理論內容

1.IF6+文獻解讀

2.單細胞常見圖表解讀

2.1降維聚類圖

2.2marker氣泡圖/小提琴圖

2.3細胞通訊圖

3.富集分析

3.1?基因?ID

3.2弦表圖

3.3?和弦圖

4.細胞通訊基本原理

5.反卷積

5.1系數表

5.2 bulk?轉錄組矩陣

實操內容(?IF6+文獻文獻為例)

1.單細胞差異基因分析并繪制火山圖

2.GO/KEGG富集分析并繪制氣泡圖、柱狀圖、弦表圖?

3.iTALK分析不同細胞的通訊情況

4.Cibersortx

4.1單細胞數據處理

4.2 bulk?數據

4.3推測?bulk?數據新細胞類型的比例)

第四天

理論內容

1.深度學習入門

1.1基本概念

1.2?常用方法

1.3科研應用

2.LASSO的原理和作用

2.1正則化

2.2懲罰參數

2.3變量收縮

3.Randomforest的原理和作用

3.1?Bagging思想

3.2 OOB error

3.3 Bagging?框架參數(n_estimators、oob_scorecriterion)

3.4決策樹參數

4.SVM的原理和作用

4.1最大間隔超平面

4.2支持向量

4.3SVM最優(yōu)化問題

5.ROC曲線的原理和作用

5.1二分類

5.2 true negative;falsenegative

5.3 true positivetruenegative

內容

1.LASSO的應用

1.1 lambda?選擇

1.2?特征選擇

2.Randomforest的應用

2.1 error?

2.2氣泡圖

2.3?棒棒糖圖

3.SVM的應用

4.ROC?曲線的應用

第五天

理論內容

1.深度學習結合單細胞的應用

1.1?細胞亞群

1.2特征基因篩選

1.3?基因后續(xù)驗證的科研思路

2.解析深度學習結合單細胞的文獻(IF8+)

3.LASSO與單細胞聯合

4.Randomforest與單細胞聯合

5. SVM-RFE與單細胞聯合

5.1支持向量機

5.2遞歸消除

6.人工神經網絡?ANN?與單細胞聯合

6.1?人工和生物神經網絡之間的相似性

6.2?神經元模型

6.3?神經網絡模型

6.4?前饋神經網絡

6.5反饋神經網絡

6.6 M-P?模型

6.7 neuralnet

實操內?(IF8+文獻為例)

1.單細胞分析(包括數據讀取、聚類降維、細胞注釋等)?

2.LASSO篩選特征基因并構建預后模型??????????????

3.生存曲線檢驗預后模型的效果

4.cox?森林圖驗證風險評分是否有臨床意義

5.列線表

6.免疫治療?TIDE?與風險評分的分析

7.免疫浸潤分析風險評分與免疫微環(huán)境的關系

8.neuralnet?的基礎案例實操

9.ANN?的單細胞特征基因篩選

專題七、機器學習微生物組學

第一天

?機器學習及微生物學簡介

1.?機器學習基本概念介紹

?2.?常用機器學習模型介紹(GLM,BF,SVM,lasso,KNN等等)

?3.?混淆矩陣

?4.?ROC曲線

?5.?主成分分析(PCA

?6.?微生物學基本概念

?7.?微生物學常用分析介紹

R語言簡介及實操

?1.R語言概述

?2.R軟件及R包安裝

?3.R語言語法及數據類型

?4.條件語句

?5.循環(huán)

第二天

機器學習在微生物學中的應用案例分享

1.利用機器學習基于微生物組學數據預測宿主表

?2.利用機器學習基于微生物組學數據預測疾病狀態(tài)

?3.利用機器學習預測微生物風險

?4.機器學習研究飲食對腸道微生物的影響

微生物學常用分析(實操)

?1.?微生物豐度分析

?2.?α-diversity,β-diversity分析

?3.?進化樹構建

?4.?降維分析

?5.?基于OTU的差異表達分析,熱圖,箱型圖繪制微生物biomarker鑒定

第三天(實操)

零代碼工具利用機器學習分析微生物組學數據

1.?加載數據及數據歸一化

?2.?構建訓練模型(GLM, RF, SVM

?3.?模型參數優(yōu)化

?4.?模型錯誤率曲線繪制

?5.?混淆矩陣計算

?6.?重要特征篩選

?7.?模型驗證,ROC曲線繪制利用模型進行預測

第四天(實操)

利用機器學習基于微生物組學數據預測宿主表型(二分類變量以及連續(xù)變量)

1.?加載數據(三套數據)

?2.?數據歸一化

?3.?OUT特征處理

?4.?機器學習模型構建(RF, KNN, SVM, Lasso9種機器學習方法)

?5.?5倍交叉驗證

?6.?繪制ROC?曲線,比較不同機器學習模型模型性能評估

第五天(實操)

利用機器學習預測微生物風險(多分類)

1.加載數據

2.機器學習模型構建(RF, gbm, SVM, LogitBoost等等)

3.10倍交叉驗證

4.模型性能評估

利用機器學習預測刺激前后腸道菌群變化

1.數據加載及預處理

2.α-diversity,β-diversity分析

3.?RF模型構建(比較分別基于OUTKO,phylum的模型效果)

4.10倍交叉驗證,?留一法驗證

5.特征篩選及重要特征可視化外部數據測試模型

案例圖片:

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題八、CADD計算機輔助藥物設計

第一天上午

背景與理論知識以及工具準備

1.PDB數據庫的介紹和使用

1.1數據庫簡介

1.2靶點蛋白的結構查詢與選取

1.3靶點蛋白的結構序列下載

1.4靶點蛋白的下載與預處理

1.5批量下載蛋白晶體結構

2.Pymol的介紹與使用

2.1軟件基本操作及基本知識介紹

2.2蛋白質-配體相互作用圖解

2.3蛋白-配體小分子表面圖、靜電勢表示

2.4蛋白-配體結構疊加與比對

2.5繪制相互作用力

3.notepad的介紹和使用

3.1優(yōu)勢及主要功能介紹

3.2界面和基本操作介紹

3.3插件安裝使用

下午

一般的蛋白

-配體分子對接講解

1.對接的相關理論介紹

1.1分子對接的概念及基本原理

1.2分子對接的基本方法

1.3分子對接的常用軟件

1.4分子對接的一般流程

2.常規(guī)的蛋白-配體對接

2.1收集受體與配體分子

2.2復合體預構象的處理

2.3準備受體、配體分子

2.4蛋白-配體對接

2.5對接結果的分析

以新冠病毒蛋白主蛋白酶靶點及相關抑制劑為例

第二天

虛擬篩選

1.小分子數據庫的介紹與下載

2.相關程序的介紹

2.1 openbabel的介紹和使用

2.2 chemdraw的介紹與使用

3.虛擬篩選的前處理

4.虛擬篩選的流程及實戰(zhàn)演示

案例:篩選新冠病毒主蛋白酶抑制劑

5.結果分析與作圖

6.藥物ADME預測

6.1ADME概念介紹

6.2預測相關網站及軟件介紹

6.3預測結果的分析

第三天

拓展對接的使用方法

1.蛋白-蛋白對接

1.1蛋白-蛋白對接的應用場景

1.2相關程序的介紹

1.3目標蛋白的收集以及預處理

1.4使用算例進行運算

1.5關鍵殘基的預設

1.6結果的獲取與文件類型

1.7結果的分析

以目前火熱的靶點

PD-1/PD-L1等為例。

2.涉及金屬酶蛋白的對接

2.1金屬酶蛋白-配體的背景介紹

2.2蛋白與配體分子的收集與預處理

2.3金屬離子的處理

2.4金屬輔酶蛋白-配體的對接

2.5結果分析

以人類法尼基轉移酶及其抑制劑為例

3.蛋白-多糖分子對接

4.1蛋白-多糖相互作用

4.2對接處理的要點

4.3蛋白-多糖分子對接的流程

4.4蛋白-多糖分子對接

4.5相關結果分析

以α-糖苷轉移酶和多糖分子對接為例

5.核酸-小分子對接

5.1核酸-小分子的應用現狀

5.2相關的程序介紹

5.3核酸-小分子的結合種類

5.4核酸-小分子對接

5.5相關結果的分析

以人端粒

g -四鏈和配體分子對接為例。

操作流程介紹及實戰(zhàn)演示

第四天

拓展對接的使用方法

1.柔性對接

1.1柔性對接的使用場景介紹

1.2柔性對接的優(yōu)勢

1.3蛋白-配體的柔性對接

重點:柔性殘基的設置方法

1.4相關結果的分析

以周期蛋白依賴性激酶

2(CDK2)與配體1CK為例

2.共價對接

2.1兩種共價對接方法的介紹

2.1.1柔性側鏈法

2.1.2兩點吸引子法

2.2蛋白和配體的收集以及預處理

2.3共價藥物分子與靶蛋白的共價對接

2.4結果的對比

以目前火熱的新冠共價藥物為例。

3.蛋白-水合對接

3.1水合作用在蛋白-配體相互作用中的意義及方法介紹

3.2蛋白和配體的收集以及預處理

3.3對接相關參數的準備

重點:水分子的加入和處理

3.4蛋白-水分子-配體對接

3.5結果分析

以乙酰膽堿結合蛋白

(AChBP)與尼古丁復合物為例

第五天

分子動力學模擬(linuxgromacs使用安裝)

1. linux系統(tǒng)的介紹和簡單使用

1.1 linux常用命令行

1.2 linux上的常用程序安裝

1.3體驗:如何在linux上進行虛擬篩選

2.分子動力學的理論介紹

2.1分子動力學模擬的原理

2.2分子動力學模擬的方法及相關程序

2.3相關力場的介紹

3.gromacs使用及介紹

重點:主要命令及參數的介紹

4.origin介紹及使用

第六天

溶劑化分子動力學模擬的執(zhí)行

1.一般的溶劑化蛋白的處理流程

2.蛋白晶體的準備

3.結構的能量最小化

4.對體系的預平衡

5.無限制的分子動力學模擬

6.分子動力學結果展示與解讀

以水中的溶菌酶為例

第七天

蛋白配體分子動力學模擬的執(zhí)行

1.蛋白-配體在分子動力學模擬的處理流程

2.蛋白晶體的準備

3.蛋白-配體模擬初始構象的準備

4.配體分子力場拓撲文件的準備

4.1高斯的簡要介紹

4.2 ambertool的簡要介紹

4.3生成小分子的力場參數文件

5.對復合物體系溫度和壓力分別限制的預平衡

6.無限制的分子動力學模擬

7.分子動力學結果展示與解讀

8.軌跡后處理及分析

以新冠病毒蛋白主蛋白酶靶點及相關抑制劑為例

案例實操圖片:

重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

專題九、AIDD人工智能藥物發(fā)現與設計

第一天

人工智能與藥物發(fā)現用工具的介紹與安裝

從CADD到AIDD的介紹

1.計算機輔助藥物設計(CADD)簡介

1.2.分子對接與分子動力學背景介紹

1.3.人工智能藥物發(fā)現(AIDD)簡介

2.機器學習與深度學習在藥物發(fā)現中的背景介紹

2.1藥物發(fā)現與設計

2.2基于結構的藥物發(fā)現與設計

2.3基于配體的藥物發(fā)現與設計

3.1Anaconda3/Pycharm安裝

3.2python 編程基礎

3.3Pandas基礎

3.4NumPy基礎

3.5RDKit基礎

3.6Pytorch基礎

3.7Tensorflow基礎

3.8DeepChem基礎

第二天

機器學習與藥物發(fā)現(分類任務)

1.分類模型的構建與應用

1.1邏輯回歸算法原理

1.2樸素貝葉斯算法原理

1.3k最近鄰算法原理

1.4支持向量機算法原理

1.5隨機森林算法原理

1.6梯度提升算法原理

1.7多層感知機算法原理

1.8特征工程

1.9缺失值填補

2.特征歸一化

2.1變量篩選

2.2模型評估方法

2.3交叉驗證

2.4外部驗證

3.分類模型的常用評價指標

3.1混淆矩陣

3.2準確率

3.3敏感性

3.4特異性

3.5模型選擇

3.6格點搜索超參數調優(yōu)

3.7k折交叉驗證

分類模型的實例講解與練習,以給定數據集為例,講解基于以上機器學習算法的生物活性或ADMET性質預測模型。引導學員構建自己的數據模型,并用于小分子化合物的活性或ADMET性質預測。

第三天

機器學習與藥物發(fā)現(回歸任務)

1.隨機森林回歸

2.支持向量機回歸

3.XGboost回歸

4.多層感知機回歸

5.神經網絡回歸

6.回歸模型的常用評價指標

6.1MSE

6.2RMSE

6.3MAE

6.4R2

QSAR/3D-QSAR模型

以給定數據集為例,講解基于上述幾種機器學習算法構建生物活性如pIC50或ADMET性質預測模型。

第四天

深度學習與藥物發(fā)現

1.深度學習的發(fā)展歷程與在藥物開發(fā)中的應用

1.1多層感知機/人工神經網絡

1.2基于梯度的學習

1.3反向傳播算法

1.4隨機梯度下降

1.5卷積神經網絡介紹

1.6圖神經網絡介紹

基于PyTorch的多層感知機算法的實例講解與練習

以給定數據集為例,講解基于多層感知機的化合物性質預測模型。

以給定數據集為例,講解基于卷積神經網絡的化合物圖像預測分類模型。

以給定數據集為例,講解基于圖神經網絡對化合物的毒性分類預測模型

第五天

分子生成模型

1.生成式對抗網絡(GANs)的基本原理

1.2生成器

1.3判別器

1.4循環(huán)神經網絡(RNN)

1.5長短期記憶網絡(LSTM)

2.基于上下文的循環(huán)神經網絡序列建模

3.基于字符串的小分子化合物生成模型

4.基于圖數據的小分子化合物生成模型

培訓對象

全國各大高校、企業(yè)、科研院所從事人工智能、生命科學、代謝工程、有機合成、抗體工程、酶工程、?天然產物、蛋白質、藥物、生物信息學、植物學?,動物學、食品、化學化工?,??醫(yī)學、疾病、機器學習、基?因組學、農業(yè)科學、植物學、動物學?,臨床醫(yī)學、食品科學與工程、植物基因組、動物傳染病、腫瘤免疫?與靶向治療、????全基因組泛癌分析、人黏連蛋白折疊基因組機、有機合成、生物化學、病毒檢測、高通量測?序、分子生物學、功能基因組、遺傳圖譜、基因挖掘變異、代謝組學、蛋白質組學、轉錄組學、生物醫(yī)學、?轉化研究、蛋白質、癌癥、核酸、毒物學研究、生物信息、生物計算、生命科學、生態(tài)、腫瘤、遺傳、基?因改造、細胞分化、微生物、生物醫(yī)學大數據分析與挖掘、數學類專業(yè)、計算機科學、??醫(yī)學、疾病等研究?的科研人員以及人工智能愛好者

培訓特色及福利

1、課程特色–全面的課程技術應用、原理流程、實例聯系全貫穿2、學習模式–理論知識與上機操作相結合,讓零基礎學員快速熟練掌握 3、課程服務答疑–主講老師將為您實際工作中遇到的問題提供專業(yè)解答授課方式:通過騰訊會議線上直播,理論+實操的授課模式,老師手把手帶著操作,從零基礎開始講解,電子PPT和教程開課前一周提前發(fā)送給學員,所有培訓使用軟件都會發(fā)送給學員,有什么疑問采取開麥共享屏幕和微信群解疑,學員和老師交流、學員與學員交流,培訓完畢后老師長期解疑,培訓群不解散,往期培訓學員對于培訓質量和授課方式一致評價極高!
騰訊會議實時直播解答|手把手帶著操作
重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO
學員對于培訓給予高度評價
重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO
學員培訓后投頂刊
重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO

授課時間及地點

CRISPR-Cas9基因編輯技術2023.7.30 全天授課(上午09.00-11.30 下午13.30-17.00)2023.8.5 —–2023.8.6 全天授課(上午09.00-11.30 下午13.30-17.00)2023.8.12—–2023.8.13全天授課(上午09.00-11.30 下午13.30-17.00)蛋白質晶體結構解析2023.08.01—-2023.08.04晚上授課(晚上19.00-22.00)2023.08.05 —–2023.08.06 全天授課(上午09.00-11.30 下午13.30-17.00)2023.08.08—–2023.08.09晚上授課(晚上19.00-22.00)

深度學習基因組學

2023.07.29—–2023.07.30全天授課(上午09.00-11.30下午13.30-17.00)

2023.07.30—–2023.07.31晚上授課(晚上19.00-22.00)

2023.08.05—–2023.08.06全天授課(上午09.00-11.30下午13.30-17.00)

2023.08.07—–2023.08.08晚上授課(晚上19.00-22.00)

機器學習代謝組學

2023.8.5 —–2023.8.6 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.8—–2023.8.9晚上授課(晚上19.00-22.00)

2023.8.12—–2023.8.13全天授課(上午09.00-11.30 下午13.30-17.00)

機器學習轉錄組學與表觀組學

2023.07.29 —–2023.07.30 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.08.05—–2023.08.06 全天授課(上午 09.00-11.30 下午 13.30-17.00)

2023.08.12—-2023.08.13 全天授課(上午 09.00-11.30 下午 13.30-17.00)

深度學習單細胞分析

2023.8.5 —–2023.8.6 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.8—–2023.8.9晚上授課(晚上19.00-22.00)

2023.8.14—–2023.8.15全天授課(上午09.00-11.30 下午13.30-17.00)

機器學習微生物組學

2023.8.5 —–2023.8.6 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.8—–2023.8.9晚上授課(晚上19.00-22.00)

2023.8.12—–2023.8.13全天授課(上午09.00-11.30 下午13.30-17.00)

CADD計算機輔助藥物設計專題培訓班

2023.7.29 —–2023.7.30 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.1—–2023.8.4晚上授課(晚上19.00-22.00)

2023.8.5—–2023.8.6全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.8—–2023.8.9晚上授課(晚上19.00-22.00)

AIDD人工智能藥物發(fā)現與設計專題培訓班

2023.8.5 —–2023.8.6 全天授課(上午09.00-11.30 下午13.30-17.00)

2023.8.8—–2023.8.9晚上授課(晚上19.00-22.00)

2023.8.12—–2023.8.13全天授課(上午09.00-11.30 下午13.30-17.00)

培訓費用

CADD計算機輔助藥物設計;AIDD人工智能藥物發(fā)現與設計;深度學習基因組學;機器學習轉錄組學與表觀組學;蛋白質晶體結構解析、深度學習單細胞分析公費價:每人每班¥5880元 (含報名費、培訓費、資料費)自費價:每人每班¥5480元 (含報名費、培訓費、資料費)機器學習微生物組學;機器學習代謝組學;基因編輯公費價:每人每班¥4680元 (含報名費、培訓費、資料費)自費價:每人每班¥4280元 (含報名費、培訓費、資料費)優(yōu)惠優(yōu)惠1:兩班同報:9680元

三班同報:13680元

四班同報:17000元

五班同報:20000元

六班同報:22680元

七班同報:24680元

八班同報:25680元

特惠:九班同報:26680元(原價49320元)(可免費學習一整年)

優(yōu)惠2:提前報名繳費可享受300元優(yōu)惠(僅限十五名)

證書:參加培訓并通過考試的學員,可以申請獲得工業(yè)和信息化部工業(yè)文化發(fā)展中心頒發(fā)的“工業(yè)強國建設素質素養(yǎng)提升尚工行動”崗位能力適應評測證書。該證書可在中心官網查詢,可作為能力評價,考核和任職的重要依據。評測證書查詢網址:www.miit-icdc.org(自愿申請,須另行繳納考試費500元/人

報名咨詢請二維碼掃描下方微信

報名咨詢方式(請二維碼掃描下方微信)
重磅!2023影響因子已出,Nature年度最熱技術!“里程碑與CNS寵兒”-肽度TIMEDOO