R生物信息学统计分析

执行定量 RNAseq

https://embed.notionlytics.com/wt/ZXlKd1lXZGxTV1FpT2lKaFpHSm1PV1EyTmpRMU56VTBaak5sT0dSaE1XVmhORGswTmpreE16a3dZaUlzSW5kdmNtdHpjR0ZqWlZSeVlXTnJaWEpKWkNJNklsZHNTR2hsVEZSUFdXeHpaVmRhUW1ZNU1YQmxJbjA9

使用 HTS 数据寻找遗传变异

搜索基因和蛋白质的域和基序

使用 SeqinR 检索基因组序列数据:

例如，您在上面学习了如何从 NCBI 网站检索具有 NCBI 登录号 NC_001477 的 DEN-1 登革热病毒基因组序列。要检索具有特定 NCBI 加入的序列，您可以使用下面的 R 函数“getncbiseq()”，您首先需要将其复制并粘贴到 R 中：

> getncbiseq <- function(accession)
  {
     require("seqinr") # this function requires the SeqinR R package
     # first find which ACNUC database the accession is stored in:
     dbs <- c("genbank","refseq","refseqViruses","bacterial")
     numdbs <- length(dbs)
     for (i in 1:numdbs)
     {
        db <- dbs[i]
        choosebank(db)
        # check if the sequence is in ACNUC database 'db':
        resquery <- try(query(".tmpquery", paste("AC=", accession)), silent = TRUE)
        if (!(inherits(resquery, "try-error")))
        {
           queryname <- "query2"
           thequery <- paste("AC=",accession,sep="")
           query(`queryname`,`thequery`)
           # see if a sequence was retrieved:
           seq <- getSequence(query2$req[[1]])
           closebank()
           return(seq)
        }
        closebank()
     }
     print(paste("ERROR: accession",accession,"was not found"))
  }

将函数 getncbiseq() 复制并粘贴到 R 中后，您可以使用它从 NCBI 核苷酸数据库中检索序列，例如 DEN-1 登革热病毒的序列（登录号 NC_001477）：

> dengueseq <- getncbiseq("NC_001477")

变量 dengueseq 是包含核苷酸序列的载体。载体的每个元素都包含该序列的一个核苷酸。因此，要打印出该序列的某个子序列，我们只需键入向量 dengueseq 的名称，然后输入包含这些核苷酸索引的方括号。例如，以下命令打印出 DEN-1 登革热病毒基因组序列的前 50 个核苷酸：

> dengueseq[1:50]
[1] "a" "g" "t" "t" "g" "t" "t" "a" "g" "t" "c" "t" "a" "c" "g" "t" "g" "g" "a"
[20] "c" "c" "g" "a" "c" "a" "a" "g" "a" "a" "c" "a" "g" "t" "t" "t" "c" "g" "a"
[39] "a" "t" "c" "g" "g" "a" "a" "g" "c" "t" "t" "g"

请注意，dengueseq[1:50] 指的是向量 dengueseq 的元素，其索引为 1-50。这些元件包含 DEN-1 登革热病毒序列的前 50 个核苷酸。

系统发育分析和可视化

宏基因组学

执行定量 RNAseq

使用 HTS 数据寻找遗传变异

搜索基因和蛋白质的域和基序

系统发育分析和可视化

宏基因组学

从光谱到注释的蛋白质组学