Yandex, el gigante ruso de Internet, presenta una IA que descifra manuscritos de hace un siglo

Ciencia y Tecnología
ERWANN PENSEC
Esta plataforma facilitará el trabajo de cualquiera que desee profundizar en los archivos imperiales rusos, pero carezca de los conocimientos necesarios para entender la escritura que se utilizaba antes de las reformas bolcheviques.

En 1918, el joven gobierno bolchevique emprendió una importante reforma lingüística, destinada a reducir el analfabetismo y simplificar la lengua rusa. Esto incluyó un cambio en el alfabeto, con la sustitución de algunos signos por otros y la desaparición de otros. Como resultado, los escritos anteriores a la revolución son ahora a veces difíciles de entender.

Consciente de este problema, Yandex, el gigante ruso de Internet, ha desarrollado una inteligencia artificial (IA), disponible siguiendo este enlace, que puede descifrar manuscritos de la época imperial. Tras entrenarlo a partir de un número considerable de escritos de los siglos XVIII-XIX, así como de millones de ejemplos generados artificialmente, los especialistas le han enseñado, mediante el reconocimiento óptico de símbolos, a tener en cuenta las especificidades de la escritura manuscrita, a identificar signos obsoletos y a comprender la estructura de los documentos de archivo.

En el proceso de aprendizaje de la IA, los desarrolladores utilizaron los Archivos Centrales de Moscú, pero la base de datos ya incluye los de las regiones de Oremburgo y Nóvgorod, y se irá ampliando con el tiempo.

De este modo, los usuarios pueden ahora consultar y descifrar casi 2,5 millones de documentos desde mediados del siglo XVIII hasta principios del XX. Explorando la base de datos mediante filtros, por ejemplo por año o por fondo de archivo, pero también buscando un apellido o un lugar concreto, los usuarios podrán encontrar rastros de sus antepasados. Se espera que esta herramienta sea una ayuda preciosa para historiadores, sociólogos y demógrafos, pero también para particulares que quieran reconstituir su árbol genealógico.

"Decidí experimentar y la partida de nacimiento de mi abuelo se encontró en unos 20 segundos. Mi hermano y yo habíamos buscado este documento por nuestra cuenta la primavera pasada, antes de que este servicio estuviera disponible, y la búsqueda nos había llevado varios días: tuvimos que leer a cuatro manos los libros eclesiásticos digitalizados de Moscú correspondientes al año 1915. Sin embargo, la inteligencia artificial no nos ayudó a resolver nuestro principal problema: descifrar el nombre de la ciudad polaca de la que procedía nuestra bisabuela, pero tuvimos mala suerte: el registro escrito estaba hecho de forma muy chapucera", comenta un moscovita que decidió probar este nuevo servicio.

Síguenos en nuestro canal de Telegram: https://t.me/russiabeyondes 

LEE MÁS: Caligrafía en cirílico: la antigua escritura eslava vuelve a ganar popularidad en Rusia