Investigadores de la Universidad de Granada (UGR) dirigidos por el profesor Cristóbal Lozano han desarrollado una app llamada ‘Corpus escrito del español como segunda lengua’ (Cedel2), considerada la mayor base de datos del mundo sobre su aprendizaje como idioma extranjero.
Según ha informado la UGR, Cedel2 nace para «dar respuesta a la necesidades científicos y docentes del español como lengua extranjera a nivel internacional», siendo «un corpus lingüístico de aprendices de español, es decir, una gran base de datos que contiene el lenguaje producido por aprendices de español» como segunda lengua.
Contiene, además, el lenguaje de hablantes nativos de español de España y de otras variedades de Latinoamérica (Méjico, Argentina o Colombia). De esta forma, los investigadores usan los datos de los nativos de español como referencia para ver si el lenguaje de los aprendices se acerca (o se aleja) del lenguaje de los nativos.
Aprender de aprendices
Por ejemplo, es bien sabido que los aprendices cometen errores básicos de concordancia entre el artículo y el nombre: «la clima», «la problema». Cedel2 es una herramienta informática «potentísima» que sirve a los investigadores de «ventana» para comprender cómo funciona el lenguaje en la mente de los aprendices. Asimismo, los docentes de español pueden usarlo en clase para que los estudiantes exploren y aprendan de los errores cometidos por otros aprendices como ellos.
Es gratuito, y está alojado en el portal web ‘cedel2.learnercorpora.com’. La aplicación informática cuenta con un buscador y una interfaz intuitiva y accesible. Ofrece múltiples posibilidades para la investigación y la docencia. Permite hacer tanto búsquedas sencillas de palabras como búsquedas de estructuras lingüísticas complejas.
Las búsquedas y los textos completos se pueden descargar para analizarlos más tarde. Además de textos escritos, contiene grabaciones orales. Ya se han llevado a cabo más de medio centenar de estudios internacionales y tesis doctorales con datos procedentes de Cedel2.
El corpus tiene una larga trayectoria pues lleva en desarrollo desde el año 2006 y ha sido financiado por numerosos proyectos de investigación I+D nacionales. En él ha colaborado un equipo internacional de 30 investigadores procedentes de 11 universidades.
Acceso online
Dado este carácter internacional, Cedel2 incluye datos de aprendices de español de hasta 11 lenguas maternas distintas como inglés, japonés, chino, árabe, ruso, o alemán. Actualmente, la segunda versión del corpus contiene el lenguaje producido por unos 4.400 hablantes y más de un millón de palabras, lo que lo convierte en el corpus más extenso de su categoría.
Además, está en constante crecimiento y los investigadores siguen recogiendo datos para la futura tercera versión del corpus. Cualquiera puede participar en el corpus Cedel2 a través de su portal web (‘learnercorpora.com’). Sólo hay que escribir o narrar una breve historia en español y proporcionar información sobre el perfil lingüístico. La participación está remunerada.
Paralelamente, el equipo también ha desarrollado un corpus de inglés como lengua extranjera, el ‘Corpus of English as a Foreign Language’, que sigue los mismos principios de diseño que Cedel2, lo que permite «hacer múltiples comparaciones del lenguaje producido por, por ejemplo, nativos de español que aprenden inglés» frente a «nativos de inglés que aprenden español».
Fuente: Europa Press
También te puede interesar...
- La nueva era de la educación: FP Online en Granada a… La formación profesional (FP) en línea se ha convertido en una opción atractiva y accesible para aquellos que desean adquirir…
- Planes para disfrutar de Granada incluso en verano ¿No sabes qué hacer estas vacaciones? Si eres urbanita incluso en verano, te proponemos lo siguiente: buscar alojamiento en el…
- Desarticulada la mayor organización de narcotráfico… La Policía Nacional y Guardia Civil, con el apoyo de Europol, han desarticulado en su totalidad, tras detener a los…
- Profesionales del circo intercambian experiencias en… Profesionales del circo y del teatro físico de Andalucía y el sur de Portugal participarán durante los meses de junio…
- Andalucía secuenciará los casos de viruela del mono… El consejero de Salud y Familias, Jesús Aguirre, ha indicado que a partir de mañana, 31 de mayo, la secuenciación…
- OMS sobre el brote de viruela del mono: "todavía… La Organización Mundial de la Salud (OMS) ha asegurado que el brote de viruela del mono que se ha registrado…
- Andalucía, la comunidad con mayor aumento de playas… Andalucía es la Comunidad Autónoma que mayor aumento experimenta de cara al verano de este 2022 en número de playas…
- Investigan la aparición de un cadáver, sin… La Policía Nacional ha localizado en la mañana de este jueves un cadáver en la zona de la fuente de…