www.tendencias21.net

Nuevo sistema para obtener secuencias genéticas de la literatura científica

Ofrece una precision y exhaustividad superior al 95%

Un nuevo sistema desarrollado en la Facultad de Informaticade la Universidad Politecnica de Madrid permite obtener secuencias geneticas de la literatura cientifica, con altos valores de precision (97,98%) y exhaustividad (95,77%). El sistema facilita la tarea de identificaci on y localizacion de secuencias de primers y/o probes a los investigadores, ahorrandoles una c antidad de tiempo importante, que pueden a su vez ser invertir en mejorar la calidad asistencial y/o en tareas investigadoras.

Una investigacion desarrollada en la Facultad de Informatica de la Universidad Politecnica de Madrid permite la deteccion y anotacion de secuencias geneticas pertenecientes a microorganismos responsables de enfermedad es infecciosas que aparecen en un manuscrito dado, aceptando varios formatos para dicho articulo, entre ellos el PDF, el sistema de representacion de documentos mas utilizado por los investigadores.

Ademas, la investigacion ha reutilizado las mismas tecnicas de deteccion de secuencias geneticas para crear un indice con todos los articulos de PubMed Central PMC, la base de da tos bibliograficos que proporciona libre acceso a obras cientificas biomedicas y biologicas. La investigacion ha asociado a cada articulo de PubMed Central las secuencias geneticas detectadas.

Segun publica la FIUPM en un comunicado, el metodo de deteccion de secuencias presenta unos altos valore s de precision (97,98%) y exhaustividad (95,77%). El sistema de anotacion ha encontrado satisfactoriamente el nombre del microorganismo asociado a las secuencias en un alto porcentaje de ocasiones: se ha podido anotar correctamente las secuencias con el nombre del organismo en un 83,29% de los casos. Hay que destacar al respecto que en el 15,45% de los casos, esta anotacion era imposible, ya que las secuencias a anotar no pertenecian a microrganismos responsables de enfermedades infecciosas


Detección y anotación de secuencias genéticas

Respecto a los nombres de gen, la investigacion solo ha podido encontrarlos en un 44,32% de los casos debido a que la informacion a recuperar no esta siempre contenida en las bases de datos e, incluso, puede no ser conocida todavia.

Por ultimo, la investigacion ha reutilizado la deteccion y anotacion de secuencias geneticas para asociar a cada articulo de PubMed Central las secuencias geneticas que contiene. En el momento de la creacion del indice, la cantidad de articulos descargables de PMC era de 176.672. Como se disponia de una version de cada articulo en formato XML, se utilizo este formato de representacion porque reduce los tiempos respecto al tratamiento de articulos en PDF.

Aunque el sistema desarrollado en la FIUPM es completamente funcional y ofrece resultados utiles y precisos, abre nuevas vias de investigacion para su perfeccionamiento tanto en terminos de funcionalidad como de mejora de resultados y de rendimiento.

Los resultados de esta investigacion se han publicado en la revistaBMC BioinformaticsEn ella estan implicados miembros del Departamento de Inteligencia Artificial, el Grupo de Informatica Biomedica y el Departamento de Lenguajes y Sistemas Informaticos, todos ellos de la FIUPM. Asimismo, ha participado en la investigacion la unidad de Bioinformatica y salud publica del Instituto de Salud Carlos III.

Por la FIUPM, sus autores son Miguel Garcia-Remesal, Alejandro Cuevas, Guillermo de la Calle, Diana de la Iglesia, David Perez-Rey, Jose Crespo y Vcctor Maojo. Por el Instituto de Salud Carlos III firman Victoria Lopez-Alonso, Guillermo Lopez-Campos y Fernando Martin-Sanchez.

Anteriormente, esta investigacion habia dado origen a otro articulo en la revista lider del area de la Bioinformatica, Bioinformatics, sobre la aplicacion PubDNA Finder, el primer buscador de articulos cientificos con secuencias de acidos nucleicos del que la Facultad de Informatica de la UPM informo en otra nota de prensa.


Colores utilizados

Para el fondo #FEEFB1

#685D47

#913420

#1E2729

#C1D9C5