Con el apoyo de todo un grupo, un pirata informático pudo descargar casi 57 TB de contenido publicado en Parler, la red estadounidense de extrema derecha, antes de que se desconectara. En esta base de datos se encuentran videos, fotos y datos de geolocalización. Podría ser de gran ayuda para las diversas investigaciones en curso sobre el asalto al Capitolio, publicadas en la aplicación por muchos activistas pro-Trump.
Hablar ya no está en línea desde el domingo 10 de enero, luego de que su anfitrión, Amazon Web Service, decidiera romper el contrato entre ellos. Pero el contenido de red social derecha dura American, sin embargo, todavía se puede encontrar en línea. Y por una buena razón, un usuario de Twitter, @donk_enby, archivó 56,7 terabytes de contenido publicado en la plataforma.
Según Vice, este gigantesco conjunto de datos contiene 412 millones de archivos, incluidos 150 millones de fotos y más de 1 millón de videos. Eso equivale del 96 al 99% de todas las publicaciones de la red social de la extrema derecha, según diversas fuentes.

Para tener éxito en este titánico trabajo de copia de seguridad, el hacker pudo contar con el apoyo necesario del Archive Team, un grupo de hackers e investigadores cuyo objetivo es guardar (de forma voluntaria) los datos de los sitios moribundos. Había comenzado su trabajo de recolección el 6 de enero, pero tuvo que acelerar considerablemente el ritmo y comenzar una prueba en tiempo real cuando Amazon anunció su intención de desconectar a Parler.
Ella lo compartió públicamente; fue entonces cuando el Equipo de Archivo le ofreció su ayuda. El colectivo se ha hecho cargo del costo del almacenamiento e incluso creó una herramienta para que cualquier usuario de Twitter use su ancho de banda para descargar, dice Vice. Unas horas después de la implementación de la herramienta, permitía una velocidad de descarga de 50 GB por segundo.
Metadatos en archivos públicos, una mina de oro
Esta base de datos solo contiene contenido público, que era accesible para cualquier usuario de la plataforma. Las contraseñas, los chats privados y otra información confidencial del usuario no se han visto comprometidas, o al menos no de esta manera. Por otro lado, cada foto y video viene con metadatos, ya que Parler no los eliminó de los archivos, a diferencia de las principales redes sociales. Concretamente, cuando toma una foto con su teléfono inteligente, su dispositivo adjunta datos contextuales al archivo de imagen: por ejemplo, la hora y fecha en que se tomó la foto, así como su geolocalización en ese momento.
En otras palabras, al analizar los metadatos de fotos y videos publicados en Parler, cualquiera puede rastrear las rutas de los usuarios de la plataforma o identificar sus reuniones. Todo, hora a hora. Es, por tanto, una mina de oro para investigadores, investigadores y periodistas interesados en el ataque de los partidarios de Trump en el Capitolio: el medio estadounidense Gizmodo ya lo ha demostrado. en un artículo. Hay que decir que muchos usuarios de Parler implicados en el ataque filmaron y fotografiaron los hechos en directo. Una práctica poco cautelosa que permitió identificar a muchos de los protagonistas del asalto.
Sin protección básica, Parler era fácil de copiar
Para copiar el contenido de Speak, Vice señala que @donk_enby solo usó un iPad que tenía “jailbreak” (en el que se eliminaron algunas de las medidas de seguridad implementadas por Apple) y un software de ingeniería inversa llamado Ghidra. Un material económico y fácil de obtener.
El hacker se aprovechó de un error ” absurdamente básico »En la arquitectura de Parler, como Cableado. La gestión de las URL (es decir, las direcciones) de las publicaciones por parte de la red social fue catastrófica, y permitió “desechar” fácilmente todo su contenido.
Tome la URL de un mensaje de Twitter: se construye en la forma: twitter.com/Nombre de usuario / tipo de mensaje / una larga cadena de números aleatorios. En Speak, la URL contenía solo el componente cifrado. Peor aún, la secuencia numérica no fue aleatoria, sino secuencial. Concretamente, si una publicación de Karen enviada a las 21:21 horas tenía el número 23134 en su URL, la foto de Chad enviada 10 segundos después tenía el número 23135 en su URL. Por tanto, se siguieron las URL de las publicaciones en orden cronológico.
Hablar no detectaba scripts automatizados
A partir de esta observación, automatizar la recopilación de todos los datos fue fácil con las habilidades adecuadas. Un simple script codificado en Python permitía que cada publicación se descargara una tras otra simplemente aumentando el número en la URL en 1. Debido al defecto de la arquitectura, el robot no tenía riesgo de tropezar con una URL inexistente o de perder una URL existente.
Ésta es la segunda gran debilidad de Parler.
Hoy en día, la gran mayoría de los sitios de este tipo tienen un sistema de detección de secuencias de comandos. Estas defensas pueden limitar la cantidad de conexiones si detectan actividad sospechosa, como visitar millones de páginas en solo unas horas desde un solo dispositivo. Pero, por supuesto, Parler no había desplegado dicha protección, aunque básica y de fácil acceso, y por lo tanto no limitó la copia de todo su contenido. Una bendición para los investigadores, tanto privados como públicos, que sabrán cómo utilizar esta base de datos.
Source: Numerama by cyberguerre.numerama.com.
*The article has been translated based on the content of Numerama by cyberguerre.numerama.com. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!
*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.
*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!