Ediciones compatibles con esta función: Enterprise Standard y Enterprise Plus; Education Standard y Education Plus; Enterprise Essentials Plus, y Cloud Identity Premium. Comparar ediciones
Una vez que hayas configurado las exportaciones de inventario de Drive, podrás analizar el conjunto de datos en BigQuery. En esta página se describe el esquema de la tabla y se incluyen consultas de ejemplo para generar los informes más habituales en BigQuery.
Nota: Debes configurar la facturación de tu proyecto de Google Cloud, ya que exportar y consultar tu inventario de Drive en BigQuery conlleva un coste. Habilita la facturación de tu proyecto.
Esquema de exportación de inventario de Drive
Esquema y definiciones
La exportación de inventario de Drive se añade al conjunto de datos de BigQuery con el siguiente esquema:
Nombre | Campo de esquema | Descripción |
---|---|---|
ID de artículo | id |
El identificador único del elemento de Drive. |
Versión | version |
Número de la última versión del archivo. La versión del archivo es un número que va aumentando continuamente. Refleja todos los cambios hechos en el archivo en el servidor, incluso los que el usuario no puede ver. |
ID del propietario | owner.user.id |
En el caso de los elementos que pertenecen a un usuario, el ID de usuario del propietario del archivo. |
Correo electrónico del propietario | owner.user.email |
En el caso de los elementos que pertenecen a un usuario, el correo del propietario del archivo. |
ID de unidad compartida | owner.shared_drive.id |
En el caso de los elementos de una unidad compartida, el ID de la unidad compartida. |
Creador | creator |
Correo electrónico e ID de usuario del creador del elemento. Este campo no se rellena si el creador deja de tener acceso al elemento. |
Marcas de tiempo de las capturas | snapshot_start_time_micros y snapshot_end_time_micros |
Marcas de tiempo del inicio y la finalización de la generación del informe. |
Título | title |
Título del archivo especificado por el usuario. |
Descripción | descripción |
Breve descripción del elemento. |
Estado de envío a papelera | trashed |
Indica si el elemento se ha movido a la papelera, pero aún no se ha eliminado. |
Tipo de MIME | mime_type |
Tipo de MIME del elemento. Consulta los tipos de MIME admitidos en Google Workspace y Google Drive. |
Extensión de archivo | file_extension |
Último componente de la extensión completa del archivo, que se extrae del campo de nombre. Solo está disponible para los elementos con contenido binario en Google Drive. |
Hora de creación | create_time_micros |
Marca de tiempo de creación del elemento. |
Última modificación | last_modified_time_micros |
Marca de tiempo de última modificación del elemento. |
Tamaño del archivo | file_size_bytes |
Tamaño en bytes de los blobs y los archivos de los editores de Documentos. No se notifican los elementos que no tienen tamaño, como los accesos directos y las carpetas. |
Cuota consumida | consumed_quota_bytes |
Número de bytes de la cuota de almacenamiento que consume el elemento. Esto incluye la revisión principal y las revisiones anteriores que se hayan conservado. |
ID de unidad compartida | shared_drive_id |
En el caso de los elementos de una unidad compartida, el ID de la unidad compartida. |
Unidad organizativa | org_unit_path |
Unidad organizativa del propietario del elemento. |
Etiquetas aplicadas* | applied_labels.id |
ID de la etiqueta aplicada al elemento. |
applied_labels.title |
Nombre de recurso de la etiqueta aplicada al elemento. | |
applied_labels.field_values.id |
ID de un campo, único dentro de una etiqueta o biblioteca. |
|
|
Tipo del campo. Se puede definir lo siguiente: |
|
|
Texto que se mostrará en la interfaz de usuario para identificar el campo. | |
Permisos | access.permissions.permission_id |
ID de este permiso. Es un identificador único del beneficiario. Nota: El ID de permiso no es el mismo que el ID de usuario. |
access.permissions.name |
El nombre "bonito" del valor del permiso. A continuación, se muestra una lista de ejemplos de cada tipo de permiso:
|
|
access.permissions.type |
Tipo de permiso. Los valores válidos son estos:
|
|
access.permissions.role |
Rol que concede este permiso. Los valores válidos son estos:
Nota: Consulta los roles y permisos para obtener más información sobre el tipo. |
|
access.permissions.view |
Si el permiso pertenece a una vista, el valor es |
|
|
Indica si el permiso permite que se pueda buscar el archivo. Solo se notifica para los permisos de tipo domain o anyone . |
|
access.permissions.email |
Dirección de correo electrónico del usuario o del grupo al que hace referencia este permiso. | |
access.permissions.domain |
Nombre de dominio de la entidad a la que hace referencia este permiso. Aparece cuando el tipo de permiso es user , group o domain . |
|
access.permissions.user_id |
ID de usuario asociado al correo de los permisos. |
* Hace referencia a las etiquetas aplicadas a elementos en Drive.
Ejemplos de consultas
En estas consultas se utiliza el lenguaje SQL antiguo. En los ejemplos que se muestran en este artículo, sustituye project_name.dataset_name por el nombre de tu proyecto y conjunto de datos. Más información sobre cómo consultar datos de BigQuery
Buscar elementos que se pueden localizar con la búsqueda de DriveSustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos.
Devuelve una tabla con el ID, el título, el correo del propietario y el tipo del archivo.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permission
WHERE permission.allow_file_discovery = true
)
Sustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos. Sustituye label_id por tu ID de etiqueta, que puedes obtener en el Gestor de etiquetas.
Esta consulta devuelve una tabla con el ID, el título, el correo del propietario y el tipo del archivo.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(applied_labels) AS label
WHERE label.id = label_id
)
Sustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos. Sustituye threshold por tu umbral en MB. Por ejemplo, para buscar usuarios que hayan usado más de 15 GB de almacenamiento en Drive, la penúltima línea sería HAVING total_storage_mb > 15000
.
Esta consulta devuelve el correo electrónico de usuario de la tabla y el uso total de almacenamiento de Drive en MB en orden descendente.
SELECT owner.user.email AS user_email,
SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC
Sustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos.
Esta consulta devuelve una tabla con los tipos de elementos ordenados por tamaño descendente.
SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC
Sustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos.
SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'
Sustituye project_name.dataset_name por el nombre de tu proyecto y del conjunto de datos. Sustituye [email protected] por tu usuario concreto.
Nota: Esta consulta no encuentra las acciones de compartir del usuario a través de grupos o de la pertenencia a audiencias objetivo.
SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permissions
WHERE permissions.email = [email protected]
)