问题描述
velocyto.R在win10下的安装会遇到以下错误:
通常我在数据分析的时候,使用Rstudio+Rmarkdown可以实时对数据可视化。一旦一块数据分析的代码成熟后,我会写成pipeline,但是仍然需要导出中间结果的可视化结果,以期对数据进行质控。我对图片质量的要求不高。因此直接采用png
格式。
文档太长可以不看。给个例子
|
|
这里采用inches
作为单位,是为了和Rmarkdown统一。此外,如果使用这一单位,必须指定分辨率。一般300dpi即可。
|
|
|
|
|
|
$$TPM_i = \frac{X_i}{l_i}\times\frac{1}{\sum{\frac{X_j}{l_j}}}\times10^6$$
$$FPKM_i = \frac{X_i}{l_i\times\frac{N}{10^6}} = \frac{X_i}{l_iN}\times10^6$$
$X_i$:Fragments of gene i
$l_i$:Length of gene i (KB)
N:Total fragments
$TPM_i = (\frac{X_i}{l_iN})(\frac{1}{\sum{\frac{X_j}{l_jN}}}) = \frac{FPKM_i}{\sum{FPKM_j}}$
|
|
|
|
值得注意的是,subset
函数总会返回data.frame
。推荐用subset
。
read.table
函数会自动在以数字开头的列名前加上一个’X’,可以通过如下方式去除
|
|
有时候在GEO下载发表的基因表达矩阵的时候,经常遇到如下的基因名被EXCEL自动篡改。这里介绍一个R包:HGNChelper,可以自动识别这些基因,并进行修正。
EXCEL ERROR Corrected Gene Symbol 1-Sep SEPT1 10-Sep SEPT10 11-Sep SEPT11 12-Sep SEPT12