CÓD.N06-S09-08 ONLINE

Big Data y la información masiva

Hoy, con el avance de las Tecnologías de la Comunicación,  Internet está alcanzando umbrales de información difíciles de calcular. Mientras crece el uso de dispositivos móviles la información y desinformación se convierten en ríos imparables  que inundan nuestros  correos electrónicos,  nuestras cuentas de Twitter,  FaceBook y otras plataformas de redes sociales. Los análisis pueden predecir, de alguna manera, las pautas comunes de la información teniendo en cuenta el ámbito de actuación, eventos y las características sociales y demográficas de los y las internautas. El Big Data es un excelente aliado que puede brindar las herramientas adecuadas para detectar, no solo las pautas de información, sino también de desinformación y manipulación masiva.
Mediante un monitoreo realizado durante 30 días de mensajes de Twitter y FB sobre temas trascendentales en la sociedad actual, como inmigración y brecha de género se ha llevado a cabo una investigación  para captar el contexto y el objetivo de estos mensajes.  Se han utilizado diferentes métodos sobre Big Data  para arrojar luz sobre las opiniones e intenciones manifestadas por  los internautas.

Palabras clave

Big Data información masiva modelos predictivos

Ponencia Online

Documentación de apoyo a la presentación ONLINE de la ponencia

Ver el video en youtube


Firmantes

Los autores de la ponencia

profile avatar

Elena Bandrés Goldáraz

Ver Perfil

profile avatar

Xhevrije Mamaqi

Ver Perfil

profile avatar

Ricardo Pérez Calle

Ver Perfil


Preguntas y comentarios al autor/es

Hay 10 comentarios en esta ponencia

    • profile avatar

      Xhevrije Mamaqi

      Comentó el 11/12/2020 a las 18:27:12

      Buenas tardes a todos:
      en primer lugar mis disculpas por entrar tarde pero son días de clase y ahora me he podio liberar. Hay que ir priorizando y estamos con revisión de parciales y clase de por medio.
      Gracias por los comentarios sobre el trabajo que esta presentada de forma parcial sin mayores extensiones por el tiempo limitado. No se podría explicar todo en detalles pero por lo leído creo que con el comentario ahora respondo a todos.
      Si no es fácil agrupar todo el proceso que conlleva transformar datos no estructurados como son los comentarios en datos estructurados. Generalmente trabajo con Hadoop es una programa de licencia libre pero los complementos cuestan. Es como una pila de diferentes sistemas de almacenamiento de datos no estructurados y las extensiones permiten operar. Principalmente trabajar por claves para formar grupos grandes y después para cada grupo establecer las claves relacionadas con palabras relevantes. En el trabajo se ha hecho doblemente para temas tratados que se reunieron en 4 grupos y para usuarios generadores de hilos 3 grupos. Estableciendo las claves e identificando con ello cada mensaje internamente los datos se transforman cada clave en una columna y se pueden trasladar a formato CSV que después pueden t transferirse a cualquier soporte de paquetes estadísticos una vez estructurados. Por esto es difícil extraer muchas variables a la vez ya que las claves aunque representativas pueden dejar fuera mensajes relacionados. es el error con lo que contamos y se puede reducir. Por ello aunque la base de datos que entra es grande la salida en datos estructurados se reduce eliminando mensajes que no se consideran relevantes para las palabras claves establecidas. Aunque hay mas programas que te permiten hoy en día trabajar con datos web y pueden ser mas asequibles. El problema es cuando ya no eres el administrador del sitio web porque no puedes utilizar los programas mas fáciles. Si tienes una pagina propia puedes solicitar acceso a una url de FB y con suerte estará aprobada . En este caso utilice la pagina de euroviajar a que si tengo acceso como administradora para saltar un poco todas las dificultades de acceso automático a los comentarios publicados solo en una url determinada de FB donde se había publicado la noticia. Y a partir de allí para cq contrario añadido estas avisado automáticamente. La dificultad es que por mucho que los comentarios son visibles libremente lo datos web no fácilmente lo son, hay trabas de por medio. En cuanto a los estudiantes de marketing al menos de grado si que es necesario introducir elementos básicos en el currículo al menos de los programas que mas se utilizan y como pasar de datos no estructurados a estructurados. Aun así paquetes estadísticos como STATA y SPSS ya que R les resulta mas difícil tienen extensiones validas para agrupar clientes en clúster según código postal, como recodificar mensajes por medio de palabras claves. probablemente se necesita una revisión curricular pero ya desde la formación de materias básicas, quizás puede ser una idea errónea pero probablemente debe de ser una asignatura de programación básica de lectura de datos y su transformación web conocer al menos SQL, SPARK etc como herramientas de lectura y almacenamiento de datos web.

      Responder

    • profile avatar

      Pilar Fernandez Sanchez

      Comentó el 10/12/2020 a las 20:20:53

      Muy interesante su trabajo.
      En mi opinión se debería presentar estas técnicas a los alumnos de grados como Marketing o finanzas porque puede ser de mucha ayuda en su formación y les supone sin duda una idea muy interesante y de aplicación al mundo real. ¿Cuál es en su opinión la técnica más adecuada para introducir a los alumnos en este tipo de análisis?¿Cree usted que la formación estadística recibida les facilita poder llevar a cabo análisis de este tipo o sería necesario modificarla? Muchas gracias

      Responder

    • profile avatar

      Ana Eugenia Marín Jiménez

      Comentó el 10/12/2020 a las 19:35:11

      Muy interesante su trabajo.
      Me gustaría saber, si en su opinión, sería factible introducir el análisis Big Data a estudiantes de grado en titulaciones ligadas al ámbito económico, como pueden ser los grados en Economía o Marketing e Investigación de Mercados .
      Muchas gracias.

      Responder

    • profile avatar

      Ana Eugenia Marín Jiménez

      Comentó el 10/12/2020 a las 19:31:38

      Muy interesante su trabajo.
      Me gustaría saber, si en su opinión, sería factible introducir el análisis de Big Data a estudiantes de grado en titulaciones ligadas al ámbito económico, como pueden ser los grados en Economía o Marketing e Investigación de Mercados.
      Muchas gracias.

      Responder

    • profile avatar

      Luis Javier Cabeza-Ramírez

      Comentó el 10/12/2020 a las 13:11:33

      Me parece un tema de gran interés, lo único que aún me genera muchas reticencias, específicamente todo lo relacionado con las interpretaciones del análisis de los comentarios. Me explico, mi experiencia con el análisis textual radica en el análisis de frecuencias y co-palabras. En muchas ocasiones la interpretación del análisis de text-mining puede ser bastante subjetivo si no se detalla como se ha realizado la interpretación. Mi pregunta es si habéis utilizado algún tipo de protocolo para evitar introducir algún sesgo, y lo vais a detallar en la posible publicación. Muchísimas gracias y enhorabuena.

      Responder

    • profile avatar

      Francisco Jódar Sánchez

      Comentó el 10/12/2020 a las 13:11:25

      Enhorabuena a los autores, el trabajo me parece muy interesante.

      En línea con los comentarios previos sobré el software utilizado, agradezco si también pueden aportar información sobre las condiciones de uso del mismo.

      ¿Esta metodología se puede aplicar en otras redes sociales o herramientas que están adquiriendo protagonismo en el actual modelo docente online, como por ejemplo Instagram o los podcast?
      Gracias

      Responder

    • profile avatar

      Adolfo Alberto Vanti

      Comentó el 10/12/2020 a las 12:55:57

      Felicitaciones por el trabajo. Mi pregunta está relacionada a conocer un poco más de las herramientas o alguna herramienta a usar en Big Data, principalmente con enfoque en análisis Predictiva o Prescriptiva.
      ? Vosotros podrían recomendar alguna herramienta Código Abierto para Big Data? O Mismo comentar algo de ventajas y desventajas de la herramienta que han usado?
      Estamos haciendo algunos estudios de Minería de Datos y Técnica de Clasificación con Weka. Nos está pareciendo una herramienta muy buena para el entorno de gestión empresarial porque tiene mucha interactividad para su uso (user-friendly) mismo que no conocemos toda su robustez.
      Muchas gracias. Adolfo Vanti

      Responder

    • profile avatar

      Marta miranda garcía

      Comentó el 10/12/2020 a las 11:53:02

      Muchas gracias por su trabajo.
      Me interesa conocer dado el título de la investigación su opinión sobre dos cuestiones:
      La primera, en qué momento puede considerarse que hay datos suficientes para considerarse Big data y no un análisis más convencional. Esto es importante también para mis investigaciones, dado que no todos los datos que se generan en mi opinión pueden considerarse big data.
      La segunda cuestión que les planteo es su opinión acerca de cómo el investigador puede influir en la decisión a la hora de clasificar los mensajes n polémicos o no. Es decir ¿se llegarían a resultados diferentes si los criterios para clasificar un mensaje en polémico o no?
      Muchísimas gracias. Me ha encantado su trabajo

      Responder

    • profile avatar

      Miguel Angel Solano Sanchez

      Comentó el 10/12/2020 a las 10:13:04

      Estimados/as autores/as,
      Mi nombre es Miguel Ángel Solano Sánchez, profesor en el Área de Estadística de la Universidad de Córdoba. En primer lugar, enhorabuena por el trabajo. Mi pregunta va dirigida hacia el software y/o procesos que se han empleado para la extracción de Big Data, muchas gracias.
      Un saludo cordial.

      Responder

    • profile avatar

      Rosaura Fernández Pascual

      Comentó el 09/12/2020 a las 17:58:41

      Muy interesante su estudio.
      Me gustaría saber cómo realizan el proceso de obtención, qué software utilizan para depurar los datos
      y transformar los datos web en formatos "legibles", como ustedes mencionan.
      Gracias

      Responder


Deja tu comentario

Lo siento, debes estar conectado para publicar un comentario.