|
Post by account_disabled on Jul 26, 2023 1:37:52 GMT -8
和质粒信息列于补充表 5和6中。 转录组分析 RNA-seq 读数使用 FastQC 进行质量检查 k/projects/fastqc/ ) 并使用具有默认设置的 RSubread 包对齐器以配对端模式与人类基因组组装 (GRCh37) 对齐[ 59 ]。使用特征计数(RSubread 包)和 Ensemble GTF 注释(Homo sa piens.GRCh 37.74)将映射数据转换为基因级整数读取计数。基因的表达以 RPKM(每千碱基百万读取数)为单位进行测量。 差异表达基因(DEG)分析 通过使用具有默认设置的 DESeq2 Bioconductor 软 国家电子邮件列表件包比较过表达或敲低和对照样本的基因级整数读取计数数据来分析 DEGs [ 60 ]。使用 Benjamini 和 Hochberg 方法对所得p值进行调整 (padj),以控制错误 发现率 (FDR)。通过 DESeq2确定调整后的p值 <0.05 (FDR < 0.05) 且两组之间倍数变化值≥1.5 或≤0.8 的基因被视为差异表达。 总体生存分析 在 LUAD 数据集上存 (OS) 分析。Kaplan-Meier 曲线是在 20 年随和表达数据的样本生成的。所有这些数据集的 BAM 文件均从 GDC ( portal.gdc.cancer.gov )下载,并使用特征计数从 BAM 文件中提取计数。 基因集富集分析(GSEA) 基因特征分
|
|