Experimentos

Los experimentos que se realizaron en este proyecto van desde lo más particular (análisis de una imagen sola de forma individual) hasta lo más general (análisis de un paciente a nivel global, de las imágenes de las distintas subregiones y decisión y categorización médicas).

Análisis de una imagen

El trabajo que se realiza para una imagen en particular consiste a grandes rasgos en procedimientos para el conteo de núcleos teñidos, cálculo del porcentaje, y cálculo de descriptores.

Un tumor es una masa de tejido que crece abultadamente (siendo a veces incluso palpable). Se desarrolla en un órgano determinado, y no siempre imitan el mismo tejido del órgano. Cuando nuestro organismo pierde el control del reemplazo de células, es decir, que la ploriferación celular no se da de forma normal, ocurre una multiplicación descontrolada de las células, que se acumulan y configuran un tumor cancerígeno. Un tumor puede ser benigno si este sigue generando e imitando células normales que no invaden al organismo. Sin embargo, un tumor es maligno cuando la reproducción celular es descontrolada y desordenada. Entonces estamos ante un cáncer que crece e invade otras zonas del cuerpo. En la metástasis, las células cancerosas se separan del sitio donde se originaron y forman tumores nuevos en otras partes del cuerpo. El cáncer que se disemina desde el lugar donde se formó hasta una parte del cuerpo lejana se llama cáncer metastásico.

Los tejidos de células normales tienen un núcleo generalmente pequeño y la zona que lo rodea (citoplasma) es más grande. En cambio las células cancerosas tienen un núcleo desproporcionadamente grande y un citoplasma más pequeño. Es por eso que se plantea realizar un cálculo de características de los núcleos que son detectados con la tinción como posiblemente tumorales. Por ejemplo, el valor de su área y perímetro aportará información acerca de su tamaño, entendiéndose que un tamaño mayor conlleva una posibilidad más grande de que se traten de células tumorales.

Análisis por paciente

Luego de construido el modelo de trabajo para analizar una imagen para aproximar el índice de Ki-67 en la misma, se decidió realizar pruebas sobre varios pacientes y a su vez sobre varias imágenes de diversas subregiones de ellos.

De acuerdo a lo explicado, se trabajó con conjuntos de 60 imágenes de 5 pacientes diferentes, divididas a su vez en distintas subregiones dentro de cada paciente, los cuáles identificaremos como:

Para cada paciente, se calculó el índice de Ki-67, contrastándolo con el valor que se obtiene a partir de las labels. Se intentó tomar pacientes cuyas imágenes presenten diferencias significativas entre sí de forma de evaluar el desempeño de nuestra implementación para distintas situaciones.

Luego de analizar el desempeño del método implementado mediante distintas métricas, se realizó un diagnóstico en forma semejante a la que realizan los médicos especialistas en base al porcentaje de Ki-67.

Resultados por paciente

Comparación porcentajes calculados con porcentajes del conjunto de datos

Paciente 0_1010

Figure 1: Gráfico contrastando los porcentajes calculados y del conjunto de datos para el paciente 0_1010.

En la figura 1 se puede observar que el método implementado termina computando porcentajes mayores (en algunos casos por una gran distancia) a los porcentajes que provienen de las etiquetas del conjunto de datos, para el caso del paciente 0_1010.

Paciente 11_12010

Figure 2: Gráfico contrastando los porcentajes calculados y del conjunto de datos para el paciente 11_12010.

En este caso, los porcentajes hallados aplicando el método implementado se acercan de forma razonable a los valores de referencia, como puede observarse en la figura 2.

Paciente 18_19010

Figure 3: Gráfico contrastando los porcentajes calculados y del conjunto de datos para el paciente 18_19010.

En la figura 3 se puede observar que el método implementado permite obtener valores razonables para los porcentajes excepto en aquellos casos donde los porcentajes de las etiquetas son muy bajos, caso donde generalmente los porcentajes calculados que se obtienen son mayores a los de las labels de referencia.

Paciente 29_30010

Figure 4: Gráfico contrastando los porcentajes calculados y del conjunto de datos para el paciente 29_30010.

En la figura 4 se puede observar que para este caso el método implementado permite obtener valores razonables para los porcentajes. Notamos que en algunos casos, se obtienen porcentajes inferiores a los que corresponden al conjunto de imágenes de referencia, y en otros casos se obtienen porcentajes mayores.

Paciente 38_39010

Figure 5: Gráfico contrastando los porcentajes calculados y del conjunto de datos para el paciente 38_39010.

En la figura 5 se puede observar que el método implementado genera valores que suelen ser un poco mayores a los que provienen de las etiquetas del conjunto de imágenes, pero los datos siguen una distribución similar.

Visualización de histogramas de porcentaje

Paciente 0_1010

Figure 6: Histograma mostrando los resultados para el paciente 0_1010.

En la figura 6 se pueden observar los histogramas normalizados para los porcentajes calculados mediante el método implementado y para los porcentajes obtenidos a partir de las etiquetas del conjunto de datos.

Para este paciente, se observa que se obtienen resultados de índices bastante mayores a los de las labels, por lo que para poder analizar mejor el problema ocurrido, analizaremos los datos de acuerdo a las métricas descritas previamente.

A continuación se muestran los valores que resultaron para este paciente de acuerdo a las métricas.

Métrica Valor
Root Mean Squared Error 26.51
Correlación (Earth Mover's Distance) 0.006667
Divergencia KL 2.788
Entropía Cruzada 5.532

Como podemos apreciar en los valores de las métricas, nuestra estimación toma valores que se desvían considerablemente de la predicción del conjunto de datos, algo coherente con lo que se observa en los histogramas de porcentajes para este paciente.

Paciente 11_12010

Figure 7: Histograma mostrando los resultados para el paciente 11_12010.

En la figura 7 se pueden observar los histogramas normalizados para los porcentajes calculados mediante el método implementado y para los porcentajes obtenidos a partir de las etiquetas del conjunto de datos.

Para este paciente, se observa que se obtienen resultados de índices con un comportamiento bastante similar al de los porcentajes de las labels. Notamos que incluso así, existen algunos casos donde se los indíces calculados son mayores a los de referencia.

A continuación se muestran los valores que resultaron para este paciente de acuerdo a las métricas.

Métrica Valor
Root Mean Squared Error 1.981
Correlación (Earth Mover's Distance) 0.01667
Divergencia KL 0.5030
Entropía Cruzada 3.042

En este caso, la aproximación calculada aproxima de mejor forma a los valores de referencia. Esto se evidencia en los valores que toman las métricas.

Paciente 18_19010

Figure 8: Histograma mostrando los resultados para el paciente 18_19010.

En la figura 8 se pueden observar los histogramas normalizados para los porcentajes calculados mediante el método implementado y para los porcentajes obtenidos a partir de las etiquetas del conjunto de datos.

Para este paciente, se observa que se obtienen resultados de índices con una distribución similar a la de los porcentajes de las labels. Nuevamente, existen algunos casos donde se los indíces calculados son mayores a los de referencia.

A continuación se muestran los valores que resultaron para este paciente de acuerdo a las métricas.

Métrica Valor
Root Mean Squared Error 6.127
Correlación (Earth Mover's Distance) 0.0133
Divergencia KL 1.004
Entropía Cruzada 3.334

Paciente 29_30010

Figure 9: Histograma mostrando los resultados para el paciente 29_30010.

En la figura 9 se pueden observar los histogramas normalizados para los porcentajes calculados mediante el método implementado y para los porcentajes obtenidos a partir de las etiquetas del conjunto de datos.

Para este paciente, se observa que se obtienen resultados de índices con un comportamiento bastante similar al de los porcentajes de las labels. Además, existen algunos casos donde se los indíces calculados son mayores a los de referencia.

A continuación se muestran los valores que resultaron para este paciente de acuerdo a las métricas.

Métrica Valor
Root Mean Squared Error 1.915
Correlación (Earth Mover's Distance) 0.006667
Divergencia KL 0.8653
Entropía Cruzada 3.439

Los valores de las métricas evidencian que los porcentajes calculados son una buena aproximación a los valores de referencia del conjunto de datos.

Paciente 38_39010

Figure 10: Histograma mostrando los resultados para el paciente 38_39010.

En la figura 10 se pueden observar los histogramas normalizados para los porcentajes calculados mediante el método implementado y para los porcentajes obtenidos a partir de las etiquetas del conjunto de datos.

Para este paciente, se observa que la forma de los histogramas difiere un poco más que en otros casos.

A continuación se muestran los valores que resultaron para este paciente de acuerdo a las métricas.

Métrica Valor
Root Mean Squared Error 4.817
Correlación (Earth Mover's Distance) 0.020
Divergencia KL 1.257
Entropía Cruzada 3.807

Analizando las métricas calculadas para este paciente, podemos ver que la aproximación para este paciente es razonable, a pesar de que dista un poco de los valores de referencia.

Diagnóstico a partir de los porcentajes calculados

A continuación se detallan los diagnósticos calculados para cada paciente contrastados contra los diagnósticos que se obtienen a partir de las etiquetas del conjunto de datos.

Para obtener ambos valores de diagnóstico, se realizó un promedio sobre los índices de Ki-67 en cada imagen analizada para cada uno de los cinco pacientes.

Luego, en base a la categorización de los índices de Ki-67, mostramos la categoría correspondiente para cada paciente, tanto para el porcentaje calculado, como para el que se obtiene a partir del dataset.

Paciente Diagnóstico calculado Diagnóstico labels Categoría calculada Categoría labels
0_1010 28.8 % 8.5 % Evolución Tumoral Moderada Evolución Tumoral Lenta
11_12010 8.0 % 7.3 % Evolución Tumoral Lenta Evolución Tumoral Lenta
18_19010 22.7 % 17.9 % Evolución Tumoral Moderada Evolución Tumoral Moderada
29_30010 4.7 % 3.5 % Evolución Tumoral Lenta Evolución Tumoral Lenta
38_39010 6.6 % 2.4 % Evolución Tumoral Lenta Evolución Tumoral Lenta

Se puede observar que en términos generales, se tiene un buen desempeño del método implementado, fallando únicamente en el caso del paciente 0_1010, donde el error es bastante importante (del 20 % aproximadamente), donde esto también significa que se le asigna una categoría errónea por encima de la que le corresponde, un error importante ya que de esta categorización se desprende el tratamiento a cursar por el paciente.

Como fue mencionado previamente, en un diagnóstico de cáncer de mama se hacen pruebas para averiguar si las células cancerosas se han diseminado dentro de la mama o a otras partes del cuerpo, proceso que se llama estadificación. El estado del cáncer de mama se determina por la localización del cáncer, es decir, si está únicamente en la mama o si se encuentra en los ganglios linfáticos debajo del brazo o si se ha diseminado fuera de la mama. El tipo y estadio del cáncer de mama indica a los médicos y al paciente cuál es el tipo de tratamiento que conviene o no realizar. Contextualmente, la proliferación celular, que consiste en cuán rápidamente una célula cancerosa copia su ADN y se divide en dos células, ocurre más rápidamente cuando el crecimiento del cáncer es más rápido o más agresivo. El análisis llevado a cabo no se basa en un solo método o técnica, ni en un solo marcador, sino que se toma información de diversos estudios. Debe tenerse en cuenta también que muchos de los tratamientos contra el cáncer son invasivos y acarrean de por sí consecuencias a la salud del paciente.

Un porcentaje más alto de Ki-67 indica una mayor ploriferación celular, de células con posibilidad de ser tumorales. Por ser un marcador de proliferación celular, niveles altos de Ki-67 se usan como indicador de terapia quimio adyuvante ya sea sola o complementando a la terapia hormonal.

links