Se todas as células do nosso corpo contêm todo o nosso genoma, como existem milhares de células altamente especializadas, com diferentes funções e estruturas totalmente divergentes espalhadas por aí?
É nesse contexto que precisamos entender o conceito de expressão gênica e os mecanismos epigenéticos. A vida é algo extremamente complexo e tem um poder de organização incrível. Dependendo do tecido e função da célula, determinados genes são "ligados" ou "desligados" como se fossem interruptores, ou em termos técnicos, expressos ou não. A célula cardíaca sabe quais genes precisam ser expressos para que ela seja uma célula cardíaca, o mesmo acontece com os neurônios, células epiteliais, células que formam nossas mucosas, do nosso sangue e todas as outras que compõe nosso corpo.
O termo expressão se refere ao processo de transcrição do DNA para outra molécula biológica chamada RNA e consequente tradução para uma proteína, de acordo com o código genético, os famosos códons - sequências de trincas de bases nitrogenadas, que explicarei logo o que são. Esse código é universal e todos os organismos vivos no planeta Terra o utilizam para formar suas proteínas. Muitas pessoas confundem o termo genoma com código genético.
REFERÊNCIA: O que é engenharia metabólica e como está transformando o mundo - Profissão Biotec https://profissaobiotec.com.br/o-que-e-engenharia-metabolica-e-como-esta-transformando-o-mun/ Accessed: 2021-05-06
Quase tudo nos sistemas biológicos funcionam com proteínas. Apenas como curiosidade, o genoma humano completo possui aproximadamente 3,2 bilhões de pares de bases. Em resumo, a expressão gênica se refere ao processo no qual um gene ou DNA codificante produz uma proteína, esse processo também é conhecido como Dogma Central da Biologia Molecular. A regulação da expressão gênica é algo extremamente importante para qualquer organismo vivo, pois modula os processos biológicos de acordo com eventos intracelulares e com o ambiente. Existem diversos mecanismos pelos quais os seres vivos controlam a expressão gênica, estudados a fundo no campo da epigenética (acima do gene) e que não serão discutidos aqui com profundidade.
O dicionário de dados está disponível no início do notebook, lá é explicado como os dados estão organizados, quais são as variáveis e o que elas representam.
REFERÊNCIA: Um exemplo simples de agrupamento com 40 genes medidos em duas condições diferentes. D'haeseleer, P. How does gene expression clustering work?. Nat Biotechnol 23, 1499–1501 (2005). https://doi.org/10.1038/nbt1205-1499
Dados
: A pasta contém os arquivos em formato CSV utilizados.Notebook
: Arquivo do jupyter notebook com o script completo do projeto. Clique aqui para acessar o script.img
: Contém os arquivos de imagens utilizadas no projeto e na apresentação do projeto.