Santa Fe, jueves 18 de julio de 2019

Proyectos de Investigación: Modelos y algoritmos para minería de datos en bioinformática. (CAI+D)

Proyecto Modelos y algoritmos para minería de datos en bioinformática.
Convocatoria 2011
Director Stegmayer, Georgina
Programa al que pertenece Señales, Sistemas e Inteligencia Computacional
Director del programa: Rufiner, Leonardo
Resumen El procesamiento y descubrimiento de relaciones en la enorme cantidad de datos que deben analizarse en ciertas áreas de la biología representan actualmente grandes desafíos. Los avances técnicos logrados por la genómica, la metabolómica, transcriptómica y proteómica en los últimos años ha aumentado significativamente la cantidad de datos que los biólogos pueden medir sobre diferentes aspectos de un organismo. Además, estos conjuntos de datos biológicos tienen características adicionales: su inherente complejidad biológica y una cantidad significativa de ruido y datos faltantes. Desde el punto de vista de la aplicación, una tendencia actual es lograr la integración de diferentes tipos de datos biológicos para poder poner de manifiesto correlaciones ocultas entre ellos que permitan inferir nuevos conocimientos acerca de los procesos biológicos que los involucran. Sin embargo, descubrir patrones ocultos en este tipo de datos es actualmente un reto ya que el empleo de cualquier tipo de algoritmo para reconocimiento de patrones se ve entorpecido por la llamada maldición de la dimensionalidad (número limitado de muestras y un muy alto número de dimensiones). Esto pone en evidencia la necesidad de desarrollar nuevas técnicas tendientes a superar las limitaciones de las existentes. Se requieren nuevos modelos computacionales para realizar automáticamente tareas propias de la minería de datos, tales como la integración de muy diferentes tipos de mediciones, el agrupamiento de modo no supervisado y la inferencia de relaciones. En este proyecto se propone aplicar enfoques basados en la inteligencia computacional para realizar estas tareas sobre datos biológicos. Para la realización del presente proyecto, además de las bases de datos de dominio público, se cuenta con datos provistos por una red nacional de investigación en biotecnología. Es de su interés poder utilizar los métodos que se desarrollarán en esta investigación para poder obtener conclusiones a partir de los grandes volúmenes de datos con los cuales trabajan actualmente y cuyo tratamiento con las técnicas existentes resulta insuficiente. Entre los resultados del presente proyecto se espera que los modelos desarrollados puedan proveer un importante aporte al actual tratamiento y análisis de datos dentro del área de la bioinformática y aportar también medios novedosos para el tratamiento general de diversos problemas con datos de similares características.