Una hoja de cálculo con 40.000 filas

Facebooktwitterpinterestlinkedinmail

Rows
Ya lo decía hace unos días: 40.000 mensajes en el hilo de la Orbea Oiz en ForoMTB. ¿Eso en qué se traduce? Pues entre otras cosas en que la hoja de cálculo donde vía scraping registramos esos mensajes va ya por las 40.000 filas. Mucho material para jugar con él. Y una auténtica necesidad de manejarse bien con Excel. Porque sí, como quiera que nuestra investigación es fundamentalmente cualitativa, no quiero dar el salto a las herramientas estadísticas típicas de lo cuantitativo. Me conformo con mi Excel 😉

No obstante, soy consciente de que este volumen de información da mucho juego. A fin de cuentas 40.000 mensajes aportan un material suficientemente fidedigno de lo que está sucediendo de verdad en la comunidad que investigamos. Llevo también un registro de mensajes en los que creo reconocer una aportación especial. Sobre todo tienen que ver con «inventos» pero también con sugerencias respecto a la forma en que la marca debe proceder en su relación con los usuarios.

Hace unos días me preguntaban qué información registro de cada mensaje usando el scraping. Cuando se programa el volcando hay que identificar qué «campos» deben extraerse. En mi caso dispongo de la siguiente información:

  • IdMens: Número único que identifica cada mensaje, del 1 al 40.000.
  • Usuario: Nick del usuario que ha compartido el mensaje.
  • TextoMens: Texto del mensaje, previamente «limpiado» de caracteres que la hoja de cálculo no pueda manejar.
  • Menciones:  Recoge información del usuario a quien se responde, si es que es el caso.
  • FechaMen: Fecha en la que se ha enviado el mensaje.
  • LikesMens: Número de likes que ha recibido el mensaje.
  • UtilMens: Número de útil que ha recibido el mensaje.
  • Lk+Ut: Suma de likesútil que ha recibido el mensaje.
  • URLMens: URL única de cada mensaje.

Además, de cada usuario se contabiliza el total de mensajes que ha enviado a ForoMTB y el de likes que ha recibido. La serie temporal de estos 40.000 mensajes abarca desde su apertura el 25 de julio de 2014 hasta el 8 de mayo de 2017 con un promedio de 37 mensajes diarios.

Pues eso, ahí estamos, triangulando la recogida de información desde diferentes frentes a fin de construir un sólido edificio metodológico.

twitterlinkedinrssyoutubeinstagramflickr

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *