Analizando 16S sequencing data con ISME, QIIME2, y Texas A&M University. |
ISME son las siglas en inglés de la Sociedad Internacional para la Ecología Microbiana. Mi relación con ISME se remonta poco después de terminar mi doctorado en Texas A&M University cuando en el 2014 visité la ciudad de Seúl, en Corea del Sur, para participar en ISME15. En este simposio, tuve la oportunidad de conocer en persona a mucha gente, incluyendo algunos colegas de los cuales solamente conocía sus publicaciones. En este evento, un Profesor del cual no recuerdo su nombre me dijo:
"Para mis estudiantes es importante que sepan que si les apasionan los microorganismos, entonces les tiene que gustar las computadoras".
De acuerdo, y me permito ofrecer un buen ejemplo.
Estoy analizando en este momento datos de secuenciación masiva de una pequeña sección del gen que codifica para la subunidad 16S del ARN ribosomal. Estos datos no son nada más que secuencias genéticas (escritas en archivos como AGCTGA etc etc etc) junto con información acerca de la calidad de esas letras. Estos datos corresponden a un total de 26 muestras de ADN genómico total obtenidas de materia fecal de pacientes con estreñimiento, antes (13) y después (13) de cierto tratamiento. Estos datos están contenidos en dos archivos, uno de 1.9 GB y otro más pequeño de 715 MB. Estos archivos deben ser unidos, para despúes ser utilizados en el análisis bioinformático de las comunidades microbianas presentes en las muestras al momento de muestreo.
De los muchos problemas con los que me he enfrentado con estos datos en particular, uno de ellos me obliga a enfatizar lo que me dijo aquel Profesor en Seúl. Para no alargar este mensaje demasiado, existe un paso importante en el análisis bioinformático llamado "demultiplexing", donde cada una de las secuencias es asignada a cada muestra basada en códigos de barras. Para hacer este paso, QIIME2 cuenta con el plugin demux. El problema es que han surgido varias versiones de QIIME2 y para mi sorpresa, después de 2019.4 este plugin se volvió imposible de ejecutar de manera eficiente. He dedicado, solamente a este asunto inofensivo, más de 10 horas, desde ayer sábado por la mañana. El problema conmigo, es que de alguna manera me gustan las computadoras, lo cual me permite seguir indagando en problemas cada vez más complejos sin enloquecer.
El análisis de microorganismos y sus comunidades se vuelve cada vez más computacional. Por lo tanto, si por alguna razón crees que la Ecología Microbiana o la Microbiología es lo tuyo, yo sugiero que comiences poco a poco a querer cada vez más a las computadoras.
Comments
Post a Comment