Skip to content

Latest commit

 

History

History

PAB_Lab11_differential_expr

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

Bitácora personal de la practica

Example

/Code/diff_expr_no_replicates.r "Private_Data/K562/K562.total.merged.txt" "Results"

Datos

Datos RNA-seq de ENCODE/Cold Spring Harbor Lab (CSHL)

"The Cold Spring Harbor Lab (CSHL) small RNA track depicts short total RNA sequencing data from ENCODE tissues or sub-cellular compartments of ENCODE cell lines. The protocol used to generate these data produced directional reads from the 5' end of short RNAs, RNAs shorter than 200 nucleotides in length. Libraries were sequenced using an Illumina GAIIx. These data were generated by Cold Spring Harbor Laboratories as a part of the ENCODE Consortium." (https://genome.ucsc.edu/cgi-bin/hgFileUi?db=hg19&g=wgEncodeCshlShortRnaSeq)

The used data corresponds with K562 cell line; cytosol, nucleus, nucleolus and cell localizations.

Software

install.packages("BiocManager")
BiocManager::install("edgeR")

Repaso rápido de algunos conceptos

Diseño experimental

  • Tipo de biblioteca. Por ejemplo, tipo de RNA de interés (determina que enriquecer), sí se requiere mantener la orientación del transcrito (strand-specific), o sí se requiere pareada o simple (e.g.pareada estudiar isoformas).

  • Profundidad y ancho de cobertura de secuenciación.

  • Replicas técnicas. Son replicas generadas de repetir de forma independiente el mismo protocolo experimental a la misma muestra biológica.Permite capturar la variabilidad introducida por el protocolo para reducir los sesgos introducidos por este. Dependen el protocolo, por ejemplo la secuenciación per se es altamente reproducible, pero la preparación de la biblioteca, cultivo o procedimientos tales como knockdown introducen variabilidad adicional.

  • Replicas biológicas. Se generan de aplicar el mismo protocolo experimental a diferentes muestras biológicas. Dependiendo de sí estas muestras tienen o no el mismo origen (e.g., mismo donador o el mismo modelo) se pueden clasificar, respectivamente, en isogénicas o anisogénicas.

Técnica B. Isogénica B. Anisogénica
Origen =
Muestra biológica = =

Cuantificación

El conteo de lecturas (read count) es el número de lecturas que mapean a un gen. Esta influenciado por por la longitud del transcrito, por lo que es necesario introducir correcciones por la longitud sí se desea comparar los niveles de expresión de multiples genes (lo que implica diferentes longitudes) dentro una muestra o entre multiples muestras.

Bibliografía

[1] A. L. Yunshun Chen, “edgeR.” [object Object], 2017. doi: 10.18129/B9.BIOC.EDGER.
[2] S. A. Michael Love, “DESeq2.” [object Object], 2017. doi: 10.18129/B9.BIOC.DESEQ2.
[3] M. I. Love, S. Anders, V. Kim, and W. Huber, “RNA-Seq workflow: gene-level exploratory analysis and differential expression,” F1000Res, vol. 4, p. 1070, Nov. 2016, doi: 10.12688/f1000research.7035.2.
[4] “Terms and Definitions,” The Encyclopedia of DNA Elements (ENCODE). Accessed: May 16, 2024. [Online]. Available: https://www.encodeproject.org/data-standards/terms/
[5] “RNA sequencing,” Functional genomics II. Accessed: May 16, 2024. [Online]. Available: https://www.ebi.ac.uk/training/online/courses/functional-genomics-ii-common-technologies-and-data-analysis-methods/rna-sequencing/