Powermeta | Recolección de documentos y análisis de metadatos

Iniciado por HATI, Junio 28, 2018, 04:56:01 AM

Tema anterior - Siguiente tema

0 Miembros y 1 Visitante están viendo este tema.


Normalmente, cuando tenia que hacer un barrido de documentos públicos de una empresa para analizar sus metadatos, usaba FOCA. Creo que funciona bastante bien para este propósito, para lo demás...

Recientemente descubrí PowerMeta, un script en Powershell que realiza esta tarea de forma más eficiente. Es más rápido y la cantidad de metadatos puede que obtener de un documento es increíble. El único contra que le veo a diferencia de FOCA, es que solo busca en Google y Bing, aunque suele ser suficiente, a veces suelen indexarse otros documentos en diferentes buscadores.

Lo podéis descargar del siguiente repositorio: No tienes permitido ver los links. Registrarse o Entrar a mi cuenta


Requisitos:

  • PowerShell versión 3.0 o posterior


Uso:

Lo primero que debemos hacer es importar el módulo:

Código: powershell
C:\> powershell.exe -exec bypass
PS C:\> Import-Module PowerMeta.ps1



- Búsqueda básica:

Código: powershell
PS C:\> Invoke-PowerMeta -TargetDomain targetdomain.com


Por defecto, busca "pdf, docx, xlsx, doc, xls, pptx y ppt".
Una vez que haya terminado de elaborar esta lista, le preguntará al usuario si desea descargar los archivos del dominio de destino. Después de descargar los archivos, se volverá a solicitar la extracción de los metadatos de esos archivos.


- Cambio de FileTypes y descarga y extracción automática:

Código: powershell
PS C:\> Invoke-PowerMeta -TargetDomain targetdomain.com -FileTypes "pdf, xml" -Download -Extract



- Extraer todos los metadatos de archivos en un directorio:

Código: powershell
PS C:\> Invoke-PowerMeta -TargetDomain targetdomain.com -ExtractAllToCsv all-target-metadata.csv


Cuando abrais el archivo csv, vais a ver la cantidad de datos extraidos, que no son pocos.

La herramienta tiene más opciones para realizar búsquedas personalizadas que se ajusten a nuestros requisitos:

Código: powershell

TargetDomain        - The target domain to search for files.
FileTypes           - A comma seperated list of file extensions to search for. By default PowerMeta searches for "pdf, docx, xlsx, doc, xls, pptx, ppt".
OutputList          - A file to output the list of links discovered through web searching to.
OutputDir           - A directory to store all downloaded files in.
TargetFileList      - List of file links to download.
Download            - Instead of being prompted interactively pass this flag to auto-download files found.
Extract             - Instead of being prompted interactively pass this flag to extract metadata from found files pass this flag to auto-extract any metadata.
ExtractAllToCsv     - All metadata (not just the default fields) will be extracted from files to a CSV specified with this flag.
UserAgent           - Change the default User Agent used by PowerMeta.
MaxSearchPages      - The maximum number of pages to search on each search engine.


Jugar o perder