La pandemia de la Covid-19 ha sido, quizás, la mayor tragedia mundial que nos ha deparado este año 2020. Miles de personas han perdido la vida en todo el mundo y muchas otras se han contagiado de esta enfermedad. Inevitablemente, nuestro día a día se ha visto alterado para evitar que las cifras de víctimas se agranden más y, poco a poco, la Covid-19 ha modulado nuestra forma de trabajar, de relacionarnos y de actuar en determinados espacios. En este estudio exploratorio, hemos querido analizar el lenguaje empleado en época de la Covid-19 para despedir a las víctimas. En concreto, nos hemos centrado en el estudio de las características que comparten los textos escritos en español y en inglés en los memoriales de los medios de comunicación públicos nacionales de España (RTVE) y el Reino Unido (BBC). Así pues, con este objetivo, hemos recopilado dos corpus, de dimensiones reducidas, que han constituido nuestro objeto de trabajo: los textos extraídos del memorial de RTVE han conformado el corpus MEM-ES (106 792 palabras) y los del memorial de la BBC el MEM-EN (11 006 palabras). Para realizar el análisis de cada uno de ellos, hemos utilizado las listas de palabras frecuentes, de palabras clave y las concordancias obtenidas con la herramienta informática WordSmith Tools 6.0. Las listas de palabras frecuentes nos han permitido generar una serie de hipótesis primerizas que más adelante hemos descartado o reafirmado con la exploración de las palabras frecuentes. Las listas de palabras frecuentes las hemos generado a partir de las listas de referencia de la RAE y del BNC sobre el Log-Likelihood de Ted Dunning. Para aunar en nuestro estudio datos tanto cuantitativos como cualitativos, hemos ilustrado y aclarado las estadísticas con ejemplos extraídos de las concordancias proporcionadas por WordSmith Tools 6.0. A partir de todo ello, nuestro estudio ha arrojado una serie de datos referentes al uso que se hace en estos corpus de los tiempos verbales, de los pronombres y determinantes posesivos y de los sustantivos relacionados con el paso del tiempo, entre otros, que nos han llevado a revalidar algunas de nuestras hipótesis primerizas y a plantear otras nuevas. Sin embargo, debido al tamaño reducido de nuestros corpus, para consolidar estas hipótesis, se requiere de estudios posteriores.
Palabras clave
Ponencia Online
Documentación de apoyo a la presentación ONLINE de la ponencia
Maria Clotilde Almeida
Comentó el 13/12/2020 a las 22:35:50
Dear Angela
Congratulations on your investigation! Could you find substancial semantic differences between the Spanish and British corpora as far as nouns and verbs are concerned? Thanks.
Kind regards,
Maria Clotilde ALmeida
Responder
Àngela Francés Herrero
Comentó el 14/12/2020 a las 21:34:15
Dear, Maria Clotilde,
Thank you very much for your words and your interest. Indeed, we have found some semantic differences between the Spanish and English Corpora regarding nouns.
Possibly, one of the most interesting differences as far as nouns are concerned is the one regarding the word "friend(s)". This is a word that we can find in the keywords list of the MEM-EN corpus. However, one of its translations into Spanish, "amigo/a(s)", is not among the keywords of the MEM-ES corpus. In fact, after using the "Log-likelihood and effect size calculator" (http://ucrel.lancs.ac.uk/llwizard.html), we have found that the difference in their use is significant. Using Hardie (http://cass.lancs.ac.uk/log-ratio-an-informal-introduction/), we have determined that the use of "friend(s)" is from 4 to 8 times higher than the use of "amigo/a(s)".
Another difference that concerns the nouns of both corpora is the use of nouns related with death. In the MEM-ES corpus we find words such as "cielo" (sky) or "alma" (soul). These words (as well as the use of future tenses) seem to point out that the authors of the Spanish texts, in general, express hope for the existence of another life after this one. However, we have not found any word related to this in the MEM-EN corpus.
We wonder if there is a cultural reason between all these differences.
Now, we want to study those words that do appear in both corpora in order to look for similarities and differences.
I hope I have answered your question.
Thank you very much.
Àngela Francés Herrero
Responder
Diego Gómez-Carmona
Comentó el 11/12/2020 a las 08:28:11
Hola Ángela,
enhorabuena por el trabajo y el manejo que tienes de los software utilizados. Viendo las conclusiones alcanzadas, me preguntaba ¿considera que estos textos apelando a la esperanza o al distanciamiento social podrían ser efectivos para realizar campañas de concienciación sobre las causas de la COVID-19?
Gracias por su respuesta.
Un saludo.
Responder
Àngela Francés Herrero
Comentó el 11/12/2020 a las 11:38:54
Buenos días, Diego,
Muchas gracias por tu comentario. La verdad es que tu pregunta me parece muy interesante. Debo admitir que nunca antes me había planteado la utilidad de estos textos para desarrollar campañas de concienciación sobre la COVID-19. Sin embargo, esta podría ser una idea muy acertada siempre que se contase con la conformidad de los autores de los textos.
Personalmente, creo que los textos del corpus MEM-ES serían los más efectivos en dicho propósito, pues, en general, en ellos se palpan las emociones de un modo más vívido que en los textos del corpus MEM-EN. También tienden a ser textos más largos en los que los autores, a menudo, hacen referencia a momentos vividos junto a sus seres queridos o a rutinas que compartían con ellos, por lo que creo que resulta más fácil empatizar e identificarse con ellos.
En definitiva, considero que, en este caso concreto, apelar a las emociones (y también a la esperanza) ayudaría a llegar más fácilmente a la gente y, por consiguiente, creo que la campaña de concienciación tendría más efecto.
Responder
María del Mar Sánchez Ramos
Comentó el 10/12/2020 a las 18:22:44
Hola Ángela:
Felicidades por su presentación: clara, sencialla y con unos resultados pertinentes. Quisiera hacerle una pregunta sobre el etiquetado del material textual a xml. ¿Podría indicarme si ha sido muy laborioso o si ha utilizado alguna herramienta en concreto? Gracias.
Responder
Àngela Francés Herrero
Comentó el 11/12/2020 a las 10:37:14
Buenos días, María del Mar:
Muchas gracias por ver la presentación y por su comentario.
Cuando planificamos los pasos que seguiríamos para recopilar los dos corpus, pensamos que, quizás, en un futuro, podría interesarnos llevar a cabo otros estudios en los que analizásemos y describiésemos el lenguaje empleado en estos memoriales atendiendo a otras características que no fuesen meramente geográficas como las del presente estudio. Por ejemplo, podríamos estudiar y comparar el lenguaje empleado según el género del autor del texto, según su edad, según el género de la persona fallecida, etc.
Así pues, con esta idea en mente de facilitar la elaboración de diferentes subcorpus para investigaciones futuras, decidimos convertir los archivos txt en archivos xml con etiquetas para metadatos diversos (nombre de la persona fallecida, edad de la persona fallecida, residencia de la persona fallecida, género de la persona fallecida, profesión de la persona fallecida, etc.). Para hacerlo, utilizamos un script básico con oneliners de perl sobre la base de expresiones regulares, es decir, líneas en perl que permiten buscar y reemplazar unidades textuales.
Espero haber dado respuesta a tu pregunta.
Un saludo,
Àngela Francés Herrero
Responder
María del Mar Sánchez Ramos
Comentó el 11/12/2020 a las 16:41:50
¡Gracias! ¡Excelente investigación!
Responder
María Calzada Pérez
Comentó el 08/12/2020 a las 21:31:45
Hola Àngela.
Excelente vídeo. Me interesa mucho la identificación de conectores clave distintos en MEM-ES y MEM-EN. ¿Podrías hablar un poco más de ellos? ¿Qué efectos tiene estos diferentes usos?
Gracias por una presentación muy instructiva.
Responder
Àngela Francés Herrero
Comentó el 11/12/2020 a las 12:36:27
Buenos días, María:
Muchas gracias por tu interés y por tu comentario.
Efectivamente, el uso de conectores es diferente en cada uno de los dos corpus. En la presentación vemos que entre las palabras clave del corpus MEM-ES figuran conectores de distintos tipos (copulativos, adversativos, etc.), mientras que entre las palabras clave del corpus MEM-EN solo figura un único conector, el conector copulativo "and".
Si analizamos los datos de manera un poco más detallada, obtenemos que, en el corpus MEM-ES, los conectores representan aproximadamente el 5 % de las palabras clave (algunos de estos conectores son: "y", "pero", "aunque", "porque", etc.). Este porcentaje, para nada desdeñable, nos lleva a pensar que nos encontramos ante textos en los que se cuida la estructura y la correlación de ideas. En el corpus MEM-EN, por el contrario el conector "and" solo representa el 1,6 % de las palabras clave. Creemos que esta diferencia en la variedad de conectores utilizados puede explicarse, en parte, por la longitud de los textos: los textos del corpus MEM-ES tienden a ser considerablemente más largos que los textos del corpus MEM-EN, por lo que puede que requieran de una cantidad mayor de conectores para lograr una buena cohesión. La puntuación, los pronombres, las oraciones de relativo y el conector "and" pueden resultar suficientes para cohesionar textos tan cortos como los que conforman el corpus MEM-EN.
Espero haber respondido a tu pregunta.
Un saludo,
Àngela Francés Herrero
Responder
María Calzada Pérez
Comentó el 11/12/2020 a las 13:55:30
Mangífica respuesta. Se percibe que conoces bien tu objeto de estudio. Me alegra que se publique en un lugar tan prestigioso porque el trabajo tan concienzudo lo merece.
Un abrazo,
mc
Responder