Proyecto VIE / Doctorado de Ingeniería

Revista ‘Nature’ destaca investigación de ingenieros del TEC que aplica inteligencia artificial a la botánica

  • Estudio demostró que es posible identificar especies de plantas utilizando computadoras para analizar imágenes de herbarios, mediante la técnica Deep Learning
  • Investigación se realizó en conjunto entre expertos de la Escuela Computación del TEC y del CIRAD e INRIA, en Montpellier, Francia
21 de Agosto 2017 Por: Johan Umaña Venegas
Captura de pantalla del artículo de Nature.

Tomado de nature.com.

La utilización de novedosas técnicas de inteligencia artificial para la identificación de especies de plantas es revolucionaria. Tanto así, que el sitio web de la prestigiosa revista Nature destacó en un reportaje una investigación internacional que sirvió para comprobar la utilidad de esta aplicación.

“Algoritmos informáticos entrenados en las imágenes de miles de plantas preservadas aprendieron a identificar automáticamente especies que han sido prensadas, secadas y montadas en pliegos de herbario, informan los investigadores”, explica Nature en un artículo del 11 de agosto titulado Artificial intelligence identifies plant species for science (Inteligencia artificial identifica especies de plantas para fines científicos).


La publicación responde a un paper (artículo científico) y a un artículo de blog publicados en el portal del journal BMC Evolutionary Biology, respecto a una investigación conjunta entre el Dr. Erick Mata y el candidato a doctor en ingeniería José Mario Carranza, del Tecnológico de Costa Rica (TEC), y especialistas del INRIA (Instituto Francés de Ciencias de la Computación) y el CIRAD (Centro de Cooperación Internacional en Investigación Agronómica para el Desarrollo), de la Universidad de Montpellier, Francia.

“El estudio, publicado en BMC Evolutionary Biology el 11 de agosto, es el primer intento de usar el Deep Learning (aprendizaje profundo) –una técnica de inteligencia artificial que le enseña a redes neuronales usando conjuntos de datos grandes y complejos– para abordar la difícil tarea taxonómica de identificar especies en colecciones de historia natural”, destaca Nature.

Vea:

“Nuestro artículo lo que trata es de destacar y de revalorizar el trabajo que se hace en los herbarios, en donde por cientos de años se han recolectado plantas, se han puesto en pliegos debidamente cuidados, debidamente mantenidos... y la verdad que son relativamente pocos los usuarios de ese material, son otros botánicos que visitan los herbarios. Entonces, nosotros, utilizando la técnica de Deep Learning, le damos mayor valor esa información para la identificación de especies de plantas“, detalla Mata.

Este trabajo es parte de los resultados de la investigación que Mata, como tutor, y Carranza, como doctorando, desarrollan en el marco del Doctorado de Ingeniería del TEC y bajo el amparo de un proyecto de investigación financiado por la Vicerrectoría de Investigación y Extensión (VIE) del Tecnológico.

“Tal vez no esperábamos tener tanto impacto como que lo publicara Nature, pero eso sin duda le da un mayor peso a la investigación. Lo relevante del artículo es que le damos un valor agregado a los herbarios, estamos usando información que no fue recolectada para un uso tecnológico de una forma innovadora.

“Nuestra investigación busca propiciar, más ahora que se destacó en Nature, un acercamiento entre los herbarios y científicos de la computación, porque ya pudimos probar que esos datos efectivamente sirven para la identificación“, destaca por su parte Carranza.

Para los especialistas, también es relevante que varias investigaciones del Doctorado de Ingeniería ya hayan tenido destaque mundial, pues este “joven” posgrado –desarrollado en conjunto entre el TEC y la Universidad de Costa Rica– apenas inició en 2015.

“Con el Doctorado estamos logrando investigaciones con mucho impacto y publicaciones importantes, porque tenemos estudiantes que están medio tiempo o tiempo completo en su doctorado. Desde que el estudiante ingresa debe tener un área de investigación y un profesor con un proyecto que los acoja, y tiene una pasantía que lo pone en contacto con la gente que está haciendo el mejor trabajo del mundo“, argumenta Mata.  

Descubrir el potencial de los herbarios

“Existen aproximadamente 3.000 herbarios en el mundo, que albergan unos 350 millones de especímenes, de los cuales sólo una fracción ha sido digitalizada. Esos ricos conjuntos de datos, junto con los avances en las técnicas informáticas, atrajeron al informático Erick Mata-Montero del Tecnológico de Costa Rica, en Cartago, y al botánico Pierre Bonnet, del Centro de Cooperación Internacional en Investigación Agronómica para el Desarrollo, en Montpellier, para ver lo que podían lograr con esta información (...).

“Los investigadores entrenaron algoritmos similares en más de 260.000 imágenes de hojas de herbario, abarcando más de 1.000 especies. Eventualmente, el programa informático identificó las especies con casi el 80% de precisión: la respuesta correcta se encontraba entre las mejores cinco elecciones de los algoritmos el 90% de las veces”, continua Nature.

Para Mata y Carranza, sus resultados constatan la utilidad de su investigación para potenciar el trabajo de los herbarios; instituciones, que según afirman, en todo el mundo han visto reducir sus presupuestos y apoyo en las últimas décadas.

“Decidimos probar cuán útiles pueden ser las imágenes de plantas que los herbarios han recolectado por tantos años y que lamentablemente no son valoradas. Nuestro interés es demostrar que sí se pueden usar, hasta dónde se pueden usar, y con eso lograr que los herbarios tengan una posibilidad de que se les reconozca más todo el trabajo que han hecho”, detalla Mata.  

Asimismo, el artículo de Nature expone el valor potencial de esta línea de investigación para recolectar información relacionada al cambio climático:

“Y este enfoque de Deep Learning permitirá a los investigadores realizar análisis adicionales. Las muestras de herbario contienen una gran cantidad de datos: cuándo y dónde se recogió la muestra, por ejemplo, y características tales como si la planta estaba floreciendo o fructificando en el momento de la recolección y cuán densamente agrupadas estaban las flores. Debido a que algunas muestras tienen siglos de antigüedad, esos datos pueden pintar un retrato de cómo las plantas se han adaptado a los climas cambiantes, un área de creciente interés ante las preocupaciones sobre el cambio climático, explica el artículo.

La investigación continúa

Los investigadores del TEC también encontraron límites al alcance de las computadoras para identificar especies, pues cuando intentaron combinar imágenes de pliegos de herbario con imágenes de plantas vivas en el campo, los resultados no fueron buenos.

“Falta investigar sobre qué tanto se pueden mezclar fotos de pliegos de herbarios con fotos de campo, para ver si ciertos patrones visuales se mantienen a pesar del proceso de secado y demás. Nosotros encontramos que no da buenos resultados, pero hay ciertos preprocesamientos que podríamos aplicar y correr luego los experimentos de nuevo. Si eso sirviera, bajo ciertas circunstancias, podría servir como para alimentar un app de celular, donde la persona está tomando fotos en el bosque y con su teléfono identifica la especie“, explica Carranza.

Ahora el estudio de Carranza se enfoca en ampliar el rango de alcance de la investigación, incluyendo datos de género y familia, para constatar si eso ayuda a la computadora a identificar de forma más acertada la especie de las plantas.   

“Pasa mucho que los datos de herbario son desbalanceados, hay muchísimas imágenes de una especie pero de otras hay muy pocas. Entonces, lo que queremos hacer para atacar este problema es tomar en cuenta el género y la familia, de forma que se puedan encontrar patrones visuales no solo a nivel de la especie, sino a nivel del género y familia. Es una cuestión de usar la taxonomía para ayudar a la identificación“, agrega Carranza.

Además, en el Doctorado en Ingeniería se desarrolla otra investigación en la misma línea, en la que el máster Geovanni Figueroa, bajo la supervisión del Dr. Mata, realiza un proceso similar de identificación de especies, pero de árboles a partir de muestras de madera.

“Ya se han hecho trabajos similares de identificación de madera, pero lo que queremos es aplicar Deep Learning y ver cómo podemos innovar y mejorar la identificación de especies de árboles en peligro de extinción o que se están viendo afectadas por el cambio climático.

“La finalidad es mantener a Costa Rica muy bien posicionada en el tema de informática para la conservación de la biodiversidad, que es algo que habíamos logrado trabajando con el InBio y ahora estamos potenciando con la ayuda de socios como el Museo Nacional y los colegas de la Escuela de Ingeniería Forestal”, concluye Mata.

Computación, Botánica, Investigación, Nature