• Actividades

    Participa con la Fundación María García-Estrada

    read more
  • Club de Amigos

    Invierte en Investigación y ayúdanos a luchar contra El Sarcoma

    read more
  • La Fundación

    Investigando sobre el sarcoma

    read more
  • Investigación

    Fundación María Garcia-Estrada

    read more
  • María

    Su Recuerdo, su Biografía, su Lucha

    read more

Proyecto “Detección de fusiones génicas patognomónicas en sarcomas mediante secuenciación masiva para mejorar el diagnóstico, la estratificación y el tratamiento de los pacientes”

Presentado a la Fundación María García Estrada por el grupo de Investigación del Dr. Enrique de Álava. Hospital Universitario Virgen del Rocío-IBiS.

 

 

 

   PRESUPUESTO

Plan de trabajo a 3 años, a razón de 25.000 euros al año.

Total: 75.000 euros.

1   RESUMEN

 

Aproximadamente 30 tipos de sarcomas se caracterizan por la presencia de 94 tipos de fusiones génicas patognomónicas derivadas de translocaciones cromosómicas. Muchas de ellas son relevantes en el proceso de sarcomagénesis, además de ser muy útiles como biomarcadores diagnósticos. Aunque bastantes sarcomas pueden identificarse bien en base al inmunofenotipo y la localización anatómica, la detección a nivel molecular de estos genes de fusión es esencial para el diagnóstico anatomopatológico correcto de las distintas entidades, y por tanto para asignar los regímenes de tratamiento adecuados. Las técnicas actuales de rutina para detectar estas alteraciones incluyen la hibridación fluorescente in situ (FISH) y la RT-PCR. Ambas técnicas requieren un tiempo y trabajo considerable, y no permiten análisis multiplex, es decir, no es posible hacer escrutinios de múltiples reordenamientos/genes de fusión de forma simultánea cuando el diagnóstico es incierto. Estas limitaciones pueden salvarse con la tecnología de secuenciación masiva o NGS (Next Generation Sequencing). La empresa colaboradora ArcherDX, Inc. (Boulder, CO, USA) ha desarrollado recientemente un sistema que permite la detección simultánea de varias fusiones génicas en una misma reacción (optimizando el recurso de la muestra), y la detección de fusiones de un gen con diversos partners (conocidos o no). En esta propuesta pretendemos adaptar y validar clínicamente como herramienta diagnóstica dicho sistema para identificar las fusiones génicas en muestras parafinadas provenientes de cuatro ensayos clínicos de tres tipos de sarcomas (sarcoma Ewing-like, tumor fibroso solitario, liposarcoma mixoide) promovidos por el Grupo Español de Investigación en sarcomas (GEIS). Evaluaremos la especificidad y sensibilidad de la técnica, comparada con las que utilizan actualmente de forma rutinaria y la relación de sus resultados con la respuesta al tratamiento. Paralelamente, esta aproximación permitirá además la identificación de nuevos genes de fusión, en sarcomas como el sarcoma pleomórfico indiferenciado, que hasta ahora se consideran t-negativas (sin translocación) y que pudieran ser dianas terapéuticas.

 

2   ANTECEDENTES Y ESTADO ACTUAL DEL TEMA

La atención a los pacientes con sarcomas, por su baja frecuencia y complejidad radiológica e histopatológica, así como por las serias consecuencias que se originan por biopsias y tratamientos inadecuados, se debe realizar por profesionales con experiencia. Muchos sarcomas requieren técnicas especiales para su correcto diagnóstico anatomopatológico. Aproximadamente la mitad de los sarcomas se caracterizan por la presencia de fusiones génicas patognomónicas derivadas de translocaciones cromosómicas (ver imagen en el Anexo). Algunos ejemplos bien conocidos son las fusiones EWSR1-ETS (predominantemente EWSR1-FLI1 y EWSR1-ERG) en Sarcoma de Ewing, PAX3-FOXO1 y PAX7-FOXO1 en rabdomiosarcoma alveolar, EWSR1-WT1 en el tumor desmoplásico de células redondas, o ETV6-NTRK3 en el fibrosarcoma infantil. Existen unos 30 tipos de sarcomas con 94 tipos diferentes de fusiones génicas, para muchas de ellas se ha establecido un papel relevante en el proceso de sarcomagénesis, además de ser muy útiles como biomarcadores (Mertens & Tayebwa, 2014; Smith et al, 2015). La reciente aplicación de las tecnologías high throughput, como la secuenciación masiva (NGS, Next Generation Sequencing) está permitiendo identificar nuevos genes de fusión como NAB-STAT6 en el tumor fibroso solitario, BCOR-CCNB3 en sarcomas Ewing-like, o YAP1-TFE3 en el hemangioendotelioma epitelioide (Deel et al, 2015). De hecho, en la medida que la progresión en la caracterización molecular se está acelerando, podría producirse un cambio gradual en el paradigma actual de la clasificación tradicional de los sarcomas basada en el tejido de origen. De esta forma, la definición de translocaciones cromosómicas recurrentes adquirirá un mayor protagonismo como referencia para la clasificación de las entidades diagnósticas. La detección a nivel molecular de estos genes de fusión es esencial para el diagnóstico anatomopatológico correcto de las distintas entidades, y por tanto para asignar los regímenes de tratamiento adecuados.

Aunque bastantes sarcomas pueden identificarse bien en base al inmunofenotipo y la localización anatómica, muchos de ellos son difíciles de diagnosticar usando exclusivamente las técnicas de rutina disponibles actualmente en los laboratorios de anatomía patológica. Algunos tipos concretos de sarcomas presentan particularidades por las que necesitamos herramientas de diagnóstico molecular nuevas y más precisas: i) Es el caso del grupo de sarcomas Ewinglike (Fletcher et al, 2013), en los que se están descubriendo nuevos tipos de fusiones génicas y se desconoce por el momento la prevalencia de las fusiones ya descubiertas. ii) Una segunda situación de interés, que supone un reto para el diagnóstico, es la heterogeneidad de la estructura molecular de las fusiones génicas dentro de la misma entidad, según el número de exones que aporta cada uno de los genes implicados en la fusión. Es el caso del tumor fibroso solitario y las fusiones NAB2-STAT6, o los diversos tipos de fusiones DDIT3-CHOP en el liposarcoma mixoide. Es interesante que en este último se encontrara, gracias a un pequeño estudio retrospectivo, una relación entre la estructura molecular de la fusión y la sensibilidad a Trabectedina (Grosso et al, 2007). Carecemos sin embargo de conocimiento sistemático que relacione los subtipos moleculares de las fusiones con la sensibilidad a fármacos. iii) Otra situación clínica relevante es la de los sarcomas pleomórficos indiferenciados. El diagnóstico de esta entidad se establece por exclusión de otras entidades, y desconocemos si existen fusiones génicas en este grupo tumoral; es muy probable que al tratarse de un grupo heterogéneo de tumores no contemos con fusiones génicas patognomónicas útiles para el diagnóstico, pero no es inverosímil que encontremos fusiones génicas que incluyan genes susceptibles de intervención terapéutica (“accionables”). Este es el caso, ya conocido del tumor miofibroblástico inflamatorio, que muestra reordenamientos de ALK, o de ROS1 (Yamamoto et al, 2015).

Actualmente, las técnicas gold standard para la identificación de fusiones génicas son la RT-PCR y la hibridación fluorescente in situ (FISH) (Barr et al, 1995; Machado et al, 2009). La detección del transcrito de fusión mediante RT-PCR requiere conocer a priori los dos genes implicados en la fusión, para diseñar los primers correspondientes que amplifican un producto de PCR de tamaño determinado, que puede ser secuenciado (Sanger) posteriormente para determinar el punto de rotura (Downing et al, 1993). En el FISH se utilizan sondas que cubren el punto de rotura de uno de los dos genes implicados en la translocación (Bridge et al, 2006) pero carece de resolución necesaria para la adecuada caracterización molecular de los genes de fusión, y la interpretación es difícil cuando las regiones reordenadas son cercanas o adyacentes (este es al caso en las fusiones NAB2-STAT6) (Mitelman et al, 2007). Además,

ambas técnicas requieren tiempo y trabajo considerable, y no permiten realizar escrutinios de múltiples transcritos de fusión de forma simultánea cuando el diagnóstico es incierto (no se tiene certeza de qué gen de fusión podría estar implicado). Otro inconveniente frecuente es la escasez de material disponible para la realización estas determinaciones.

Las limitaciones de estas técnicas pueden superarse con la tecnología actual de secuenciación masiva o NGS (Next Generation Sequencing). La tecnología NGS permite la detección simultánea de varias fusiones génicas en una misma reacción con puntos de rotura variables. Las translocaciones pueden ocurrir en cualquier parte del genoma, incluyendo intrones y otros tipos de secuencia no codificante, y también en secuencia codificante de genes que pueden presentar diferentes grados de expresión. En el caso de genes con baja expresión las translocaciones darían lugar a genes quiméricos que carecerían de relevancia biológica. Existen dos metodologías para la detección de genes de fusión mediante NGS, según el material de partida para la preparación de las librerías, DNA o RNA. La búsqueda de reordenamientos utilizando DNA es más complicada, ya que para la captura de secuencias híbridas se requieren muchas más sondas que cubran amplias regiones intrónicas, que pueden ser repetitivas. Esto supone un encarecimiento de la técnica, más espacio en los equipos de secuenciación, y la necesidad de contar con más tejido tumoral para el análisis. En cambio, el RNA permite la detección de genes de fusión y determinar su grado de expresión (potencialmente oncogénicos) utilizando además muchas menos sondas, ya que durante el procesamiento del mRNA se maduran las secuencias intrónicas. Esto permite elevar el grado de multiplexing con menos material de partida. Existen muchos estudios en los últimos años que han empleado diferentes variantes de secuenciación de transcriptoma (RNA-Seq), en tumores más prevalentes, como los carcinomas de mama, pulmón y próstata, que han contribuido a la caracterización de cientos de fusiones génicas. El número de estudios de este tipo es menor en sarcomas, pero ya se han identificado 18 nuevos genes de fusión mediante RNA-Seq (Mertens & Tayebwa, 2014). Sin embargo, se estima que existe un gran número de genes de fusión por identificar. Por ejemplo, en tumores de partes blandas se han descrito unos 2280 cariotipos aberrantes, de los que 750 son translocaciones balanceadas (Mitelman et al, 2013). Además, los genes de fusión también pueden originarse a partir de reordenamientos no balanceados. Por lo tanto, estos datos citogenéticos indicarían efectivamente que deben existir muchos más genes de fusión que los descritos hasta la fecha.

La identificación de los transcritos de fusión con NGS se ha venido realizando mediante la aproximación de librerías de captura con primers opuestos (paired-end sequencing). Este sistema requiere conocer previamente los dos partners del gen de fusión, para diseñar primers específicos para cada uno de ellos. Tras la amplificación con estos primers, se realiza la ligación de adaptadores necesarios para la amplificación adicional y para el proceso de secuenciación. La empresa colaboradora (ArcherDx) ha desarrollado un sistema alternativo de enriquecimiento de la librería en los genes de interés, que incrementa la sensibilidad la detección de los transcritos de fusión mediante RNA-Seq. La principal ventaja del sistema, denominado Anchored Multiplex PCR (AMP, ver imagen en el Anexo), es que no se precisa conocer previamente los dos partners del gen de fusión. El sistema utiliza un primer específico unidireccional de uno de los genes implicados en la fusión, junto con un primer reverse que hibrida en una secuencia del adaptador (que se liga a los fragmentos antes de la amplificación). Con esta aproximación, las regiones de captura, conteniendo partners conocidos o no, se amplifican selectivamente. Esto aumenta la sensibilidad analítica del ensayo eliminando falsos negativos, que realmente podrían corresponder a variantes de la fusión no descritas previamente (partner nuevo). El análisis bioinformático posterior determina el segundo partner (conocido o no) de la fusión. Para utilizar de forma eficiente la capacidad throughput de los secuenciadores, se deben secuenciar varias muestras distintas de forma simultánea. Las diferentes muestras en el pool se identifican con una secuencia adaptadora que forma parte del MCB (molecular barcode) ligado a la secuencia de nucleótidos de interés durante la preparación de la librería, y que se leerán durante el subsiguiente proceso de secuenciación. Esta secuencia única para identificar a cada muestra en el pool recibe el nombre de index. El sistema de ArcherDx utiliza una combinación de dos índices para distinguir las distintas muestras. El primer índice se añade durante el paso de ligación del adaptador y está embebido en los adaptadores MBC. El segundo índice se incorpora en la segunda PCR. En consecuencia, se pueden discriminar las lecturas del secuenciador para las cadenas sentido y antisentido. Esto añade una ventaja adicional sobre el sistema tradicional de paired-end sequencing con el que se pierde la especificidad de cadena. Esto es importante en el caso del análisis de muestras parafinadas. Durante el proceso de fijación de los tejidos con formalina se puede producir deaminación hidrolítica de las citosinas que pasan a uracilos. Esto resulta en artefactos del tipo C>T/G>A tras las amplificaciones de PCR, que con la química AMP pueden detectarse porque una de las cadenas conserva la G invariable y no se producen falsas llamadas SNV.

La tecnología descrita constituye una innovación muy significativa, que resuelve de forma muy eficiente el reto de la detección de genes de fusión mediante NGS, con un alto grado de potencial aplicación a la práctica clínica para el diagnóstico diferencial de los sarcomas. Creemos que dicha tecnología necesita ser validada clínicamente, y necesitamos hacerlo especialmente en el ámbito clínico de las entidades a las que hacemos referencia en los primeros párrafos de esta sección. Para ello será necesario adaptar la técnica a la resolución de los problemas concretos que planteamos, pero esto servirá de punto de partida para su aplicación rutinaria también en tumores más prevalentes.

Debemos asimismo destacar que el componente de discovery asociado a la aplicación de esta técnica, repercutirá en la profundización sobre la caracterización molecular de entidades raras poco estudiadas. Esta propuesta incluye muestras de pacientes de cinco cohortes prospectivas diferentes de sendos ensayos clínicos de Grupo español de Investigación en sarcomas (GEIS) en las que creemos que la tecnología descrita, ligeramente adaptada, podría ser muy eficiente para el diagnóstico e individualización terapéutica de los sarcomas

 

3  OBJETIVOS

  1. Diseño y validación clínica de sistemas de captura NGS de fusiones génicas como herramienta diagnóstica. Queremos identificar de manera simultánea todas las fusiones génicas presentes en muestras de sarcomas incluidos en parafina (el material clínico de rutina). Para la validación realizaremos las comparaciones pertinentes con las técnicas de rutina, FISH y RT-PCR (seguida de secuenciación Sanger), evaluando especificidad y sensibilidad. También determinaremos el tiempo de demora diagnóstica y la cantidad necesaria de material de biopsia para llegar a un diagnóstico molecular. Todas las determinaciones NGS se llevarán a cabo utilizando el nuevo sistema de librerías (FusionPLex) desarrollado recientemente por la compañía ArcherDX, Inc. (Boulder, CO, USA). El sistema de captura está diseñado para un panel concreto de genes que modificaremos para adaptarlo a loci específicos (ver a continuación). En este apartado el estudio estudio se centrará de manera especial en 120 casos distribuidos en tres cohortes de pacientes, cada uno de ellos con clara aplicabilidad clínica, tomados de sendos ensayos clínicos del Grupo Español de Investigación en sarcomas (GEIS) con consentimiento informado de los pacientes:

– Se seleccionarán 30 pacientes cuyo tumor muestre una morfología compatible con sarcoma Ewing-like (BCOR-CCNB3; CICDUX4). En estos casos se realizará en primer lugar un estudio con sondas no comerciales de FISH para reordenamientos de BCOR y de CIC, respectivamente, diseñadas y validadas en nuestro laboratorio en 2015. Los casos se obtendrán del estudio europeo EuroEwing-EEC (GEIS-34) del que nuestro grupo coordina a nivel nacional la confirmación diagnóstica centralizada. En este caso modificaremos el panel FusionPlex para incluir BCOR en lugar de CCNB3 para poder comparar los resultados con los obtenidos con la sonda de FISH para BCOR.

– Se estudiarán también 50 pacientes con tumor fibroso solitario, especialmente de sus variantes maligna y desdiferenciada. En primer lugar, realizaremos técnica de FISH usando una sonda no comercial para reordenamientos de STAT6 que hemos validado y patentado previamente (Nº registro: P201531898). Los pacientes se obtendrán del ensayo clínico GEIS-32 (Ensayo clínico abierto fase II con Pazopanib administrado en solitario en pacientes con tumor fibroso solitario (TFS), no operables o metastásico, o pacientes con condrosarcoma mixoide extraesquelético), de cuyo diagnóstico Anatomopatológico somos revisores centrales. Se modificará el panel FusionPlex para asegurarnos que se pueden estudiar todas las posibles variantes de fusiones génicas NAB2-STAT6. Esto permitirá determinar asociaciones entre el tipo de fusión detectada y la respuesta al tratamiento administrado en el ensayo clínico.

– En tercer lugar, seleccionaremos 40 pacientes con liposarcoma mixoide. Veinte de ellos son de grado 1 o 2 de la FNCLCC, sin componente de células redondas, y se obtendrán de la cohorte B del ensayo internacional GEIS-37 (Phase I-II prospective trial, multicenter, open label, exploring the combination of Trabectedin plus RAdiotherapy in Soft Tissue Sarcoma patients TRASTS), coordinado desde nuestro centro. Otros 20 son de alto grado (3 de la FNCLCC, con >5% de células redondas) y se seleccionarán a partir del grupo 2 del ensayo GEIS-25 (Sarcomas de partes blandas localizados de alto riesgo de extremidades y pared de tronco en adultos: un enfoque integrador que incluye quimioterapia estándar vs histotipo-dirigida neoadyuvante. Estudio colaborativo con el Grupo Italiano de Sarcomas (ISG). Se modificará el panel FusionPlex añadiendo el gen CHOP (DDIT3) para asegurarnos que se pueden estudiar todas las variantes de fusiones génicas FUS/EWS-CHOP. Esto permitirá determinar asociaciones entre el tipo de fusión detectada y la respuesta al tratamiento con Trabectedina/quimioterapia estándar administrado en el ensayo clínico.

  1. Paralelamente, los análisis NGS permitirán además la identificación de nuevos genes de fusión, contribuyendo así a la caracterización molecular de entidades poco frecuentes que hasta ahora se consideran t-negativas (sin translocación).

Inicialmente enfocaremos este apartado al estudio de una serie de 40 pacientes de sarcoma pleomórfico indiferenciado. La detección de nuevas fusiones génicas en este grupo tumoral permitirá una clasificación más precisa y una más clara orientación a las terapias dirigidas. En concreto nos centraremos en pacientes del previamente comentado ensayo clínico GEIS-25. Muchos de ellos corresponden a sarcomas pleomórficos indiferenciados. Determinaremos la presencia de fusiones génicas y validaremos aquellas que correspondan a mutaciones “accionables” (aquellas susceptibles de ser dianas terapéuticas farmacológicas; en sarcomas contamos con ejemplos en los que se incluyen ALK1 o ROS1) mediante inmunohistoquímica/FISH en matrices tisulares.

*Adicionalmente, prevemos incluir unos 55 casos de las demás entidades relevantes (alrededor de 11) representadas en el panel, seleccionando entre 3 y 6 casos de cada entidad. Considerando todos los apartados estimamos que analizaremos en total 215 muestras de tumores incluidos en parafina.

 

4   PLAN DE TRABAJO

 

PLANTEAMOS UN PLAN DE TRABAJO A 3 AÑOS

Selección de los casos para el estudio: La revisión de los especímenes a incluir en el estudio la llevarán a cabo los patólogos EDA, DM y GC (UGC Anatomía Patológica, HUVR). La información de los pacientes correspondientes, incluidos en los ensayos clínicos GEIS-25, GEIS-32, GEIS 34-, GEIS-37 (ver detalles en sección ‘objetivos’), será recabada por los oncólogos JM, y CM (UGC Oncología Integral y Oncología Pediátrica-HUVR).

Diseño de sondas adicionales para la librería de fusiones: Modificaremos el panel FusionPlex para incorporar nuevos ensayos con los que crear una librería enriquecida en nuestros genes de interés adicionales. Para ello utilizaremos el software que proporciona la empresa colaboradora, con el que es posible diseñar los primers específicos identificando previamente los transcritos y los exones diana. El software selecciona los primers con el rango óptimo de temperatura de melting y con la mínima posibilidad de hibridación inespecífica. También se comprobará que el coverage de los ensayos diseñados es el apropiado, y que no interfieren con el resto de ensayos incluidos en el panel (JDM, MB, IBiS).

Preparación de RNA a partir de muestras de tejidos parafinados, y de tejido congelado: Para la preparación del RNA a partir de muestras parafinadas utilizaremos la solución el kit Qiagen® AllPrep DNA/RNA FFPE kit (80234) junto con la solución de desparafinación, siguiendo el protocolo de extracción que no incluye los sRNAs. La elución final se realizará con soluciones sin EDTA, y para reducir el crosslinking trataremos a 80ºC durante 1h (AMB, MJH, MD, HUVR-IBiS).

Preparación de TMAs (Tissue MicroArrays) de los casos seleccionados (agrupados por entidades) que se utilizarán en las determinaciones FISH (MJH, AMB, UGC Anatomía Patológica, HUVR)

Ensayos de FISH/RT-PCR de los mismos casos analizados mediante NGS MB, AMB, MJH, MD (UGC Anatomía Patológica, HUVR).

Periodo formativo con la empresa colaboradora: Con el objeto de adquirir la formación adecuada, prevemos un periodo de formación con los especialistas de producto de la empresa colaboradora. Dicha formación incluirá el entrenamiento en la preparación de las librerías y en el análisis bioinformático específicamente dirigido a la interpretación de los datos de secuenciación para la identificación de genes de fusión (JDM, MB, HUVR-IBiS).

Preparación de librerías enriquecidas en los genes diana de interés: Seguiremos el protocolo indicado por la empresa colaboradora. En primer lugar, se realizará una reacción de síntesis de la primera cadena de cDNA utilizando ramdom hexamers a partir 20 a 200 ng de RNA. El cDNA sintetizado en la reacción de retrotranscripción contendrá sitios de inicio al azar que aseguran la representación de todos los mRNAs. Una vez obtenida la primera cadena de cDNA realizaremos un ensayo previo de control de calidad (PreSeq RNA QC Assay), que anticipará si la muestra rendirá buenos resultados en el proceso de secuenciación. El ensayo mide la cantidad de RNA amplificable con longitud suficiente para permitir que se realicen callings fiables de los genes de fusión. El ensayo consistirá en una qPCR (SylverGreen) con la que determinaremos empíricamente el umbral necesario para el panel. En principio consideraremos que los valores de Ct mayores de 30 ciclos descartarían la muestra para los análisis ulteriores, mientras que los valores de Ct por debajo de 28.5 serán indicativos de que se obtendrán lecturas de secuencia de buena calidad. (JDM, MB, MD, HUVR-IBiS)

Secuenciación en equipos Illumina (MiniSeq) y análisis de datos NGS. Para mantener una profundidad de lectura adecuada, debe determinarse qué número de muestras pueden correrse juntas en una única flow cell (asumiendo p.ej. 25 millones de lecturas por carrera si se usan los reactivos para MiniSeq). En general, cuantas más dianas contenga el panel, la profundidad de secuenciación necesaria será mayor y por tanto deberían correrse menos muestras. Como punto de partida, estimamos que el tamaño de nuestro panel para sarcomas podría contener unos 148 ensayos para 26 genes, que requerirían entre 1 y 1,5 millones de lecturas por muestra, permitiendo la secuenciación conjunta de entre 8-16 muestras. JDM, MB (UGC Anatomía Patológica -IBiS)

Análisis estadísticos: Comprobaremos la correlación entre los resultados de los ensayos FISH/RT-PCR y los datos de NGS mediante el coeficiente kappa, que ajusta el efecto del azar en la proporción de la concordancia o grado de acuerdo observada para los elementos cualitativos. También evaluaremos la sensibilidad y especificidad de cada técnica mediante curvas ROC (EDA, JM, CM, JDM, MB, UGC Anatomía Patológica-HUVR).