Investigadores extraen audio de imágenes fijas y vídeos mudos

Iniciado por AXCESS, Septiembre 29, 2023, 03:29:54 PM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.

Septiembre 29, 2023, 03:29:54 PM Ultima modificación: Septiembre 29, 2023, 10:17:07 PM por AXCESS
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

¿Y si pudieras escuchar fotos? Imposible, ¿cierto?
 
Ya no: con la ayuda de la inteligencia artificial (IA) y el aprendizaje automático, los investigadores ahora pueden obtener audio de fotografías y vídeos mudos.

Académicos de cuatro universidades estadounidenses se han unido para desarrollar una técnica llamada Side Eye que puede extraer audio de fotografías estáticas y vídeos silenciosos (o silenciados).

La técnica apunta a la tecnología de estabilización de imagen que ahora es prácticamente estándar en la mayoría de los teléfonos inteligentes modernos.

Para evitar fotografías borrosas, las cámaras tienen pequeños resortes que mantienen la lente suspendida en líquido, y luego un electroimán y sensores empujan la lente en direcciones iguales y opuestas para reducir el movimiento de la cámara.

Lo que hace Side Eye es analizar cómo las lentes de las cámaras se ajustan a los movimientos provocados por las ondas sonoras y extraer esa información de la foto o vídeo grabado para reproducir el sonido original.

Esto se debe a que, cada vez que alguien habla cerca de la lente de una cámara, provoca pequeñas vibraciones en los resortes y desvía ligeramente la luz. El ángulo cambia casi imperceptiblemente, pero definitivamente es posible detectarlos, dijeron los investigadores.

La precisión de la reconstrucción de audio de la técnica Side Eye varía del 80% al 99% según la cantidad y complejidad del sonido que se reconstruye, dijo Kevin Fu, profesor de ingeniería eléctrica e informática y ciencias de la computación en la Universidad Northeastern.

Los investigadores dicen que Side Eye actualmente no funciona con el habla de voces humanas y solo se probó con sonido de parlantes potentes. Pero no es difícil imaginar que esto sea posible en el futuro, por supuesto, y desde la perspectiva de la ciberseguridad, es bastante peligroso.

"Nuestros análisis y experimentos con diez teléfonos inteligentes demuestran cómo partes malintencionadas con conocimiento de la estructura del hardware de la cámara pueden extraer información acústica detallada de vídeos grabados, logrando reconocimiento de dígitos, hablantes y género", dijeron los investigadores.

Es por eso que su artículo se llama "Ojo lateral: caracterización de los límites de la escucha acústica POV desde cámaras de teléfonos inteligentes con persianas enrollables y lentes móviles".

La expectativa general de los usuarios de teléfonos inteligentes es que no se pueda robar información a través del sonido cuando el acceso al micrófono del teléfono inteligente está deshabilitado, pero fácilmente otorgan acceso a la cámara a las aplicaciones simplemente porque no son conscientes de la posibilidad de escuchas acústicas.

Pero si la aplicación es maliciosa (y hay muchas), los problemas aguardan, dicen los investigadores. Sí, el audio está muy apagado, pero el aprendizaje automático y la inteligencia artificial pueden ayudar a aclararlo y convertirlo en información útil.

Las contramedidas incluyen el uso de cámaras de menor calidad y mantener los dispositivos alejados de los parlantes. También se recomienda agregar materiales amortiguadores de aislamiento de vibraciones, y los fabricantes interesados en asegurar futuros dispositivos de cámara deberían centrarse en mejorar el diseño de la cámara, según el documento.

Fuente:
CyberNews
No tienes permitido ver los links. Registrarse o Entrar a mi cuenta

No tienes permitido ver los links. Registrarse o Entrar a mi cuenta