INCEpTION
Enviado por Alex Ulloa • 12 de Mayo de 2023 • Apuntes • 393 Palabras (2 Páginas) • 212 Visitas
1. Introducción
INCEpTION es una herramienta para anotar textos, es decir, permite añadir manualmente etiquetas de información a fragmentos de texto. Por ejemplo, en la figura sobre anotaciones con INCEpTION, se aprecia cómo alguien ha identificado la palabra UNESCO como una organización (es decir, una empresa, una ONG, un organismo oficial...).
Estas anotaciones pueden no solo ser de tipo NER, como las de este ejemplo (named entity recognition, es decir, reconocimiento de nombres propios y su tipología: organización, persona, lugar...), sino que se puede anotar cualquier tipo de información: morfológica (la categoría gramatical de las palabras: verbo, adjetivo...), sintáctica (sintagmas, núcleos...) y semántica.
Además de permitir la anotación de fragmentos de textos, con INCEpTION se pueden anotar relaciones entre dichos fragmentos. Estas relaciones se visualizan mediante flechas que unen unos fragmentos con otros.
Este tipo de anotación representa relaciones semánticas como las que se vieron en la primera unidad. El proyecto FrameNet al que allí se hizo referencia trata precisamente de recoger un corpus lo más grande y representativo posible de todos los frames semánticos del lenguaje. Y, para crear ese corpus, el equipo de la Universidad de Berkeley utiliza herramientas propias, similares a INCEpTION.
Por tanto, este tipo de programas tampoco tienen demasiada complicación ni misterio, lo único que hacen es facilitar la anotación manual de textos. Y, en el caso de INCEpTION, permitir la edición online (conectándose con un navegador) y en paralelo (múltiples personas con el mismo corpus al mismo tiempo).
2. Uso
Para esta unidad, no será necesario instalar INCEpTION, ya que la práctica que se hará en una actividad posterior no lo requerirá, pues se puede conectar a una demo online.
Se recomiendan, no obstante, Chrome o Safari. Por otro lado, si se deseara instalar el servidor de INCEpTION (que, como ya se ha señalado, no es algo que sea necesario en esta asignatura), se deberían seguir los pasos del manual de instalación oficial, disponible en el siguiente enlace.
Su instalación permitiría gestionar los propios corpus para que todos los clientes de la organización para la que se trabaje se conecten al servidor utilizado y anoten contenidos.
3. Funcionalidades
Como ya se ha dicho, la única funcionalidad es la anotación de corpus lingüísticos por equipos de anotadores, de forma sincronizada. Las anotaciones manuales se suelen denominar Gold Standard y sirven para entrenar algoritmos de machine learning y para comprobar después la precisión de los sistemas de anotación automática.
...