AWS : Analizando tu Data Lake con PowerBI

Luis Grados Salinas
3 min readMay 21, 2021

--

En este breve post, asumiremos que tenemos nuestro Data Lake en AWS, y hemos considerado 3 capas (Raw, stage y analytics).

En el caso que en nuestra organización se tenga la necesidad de analizar las fuentes del Data Lake con PowerBI, se explica a detalle los pasos a tener en cuenta para la integración con Athena.

Realizar los siguientes pasos para la configuración de Power BI y Athena.

Descargar el controlador ODBC para establecer la conexión entre Power BI y Athena

https://docs.aws.amazon.com/athena/latest/ug/connect-with-odbc.html

Link de de descarga del controlador ODBC-SimbaAthenaODBC

Instalamos el utilitario:

Abrir el ODBC de 64 bits en nuestro entorno local de Windows. (Inicio -> Herramientas administrativas -> ODBC64 (Abrir como administrador)

Clic en DNS de sistema -> Agregar.

Seleccionar Simba Athena ODBC Driver.

Configuramos la conexión con Athena:

S3 Output Location: Bucket en S3 donde se guardarán los metadatos de las consultas ejecutadas.

Clic en Authentication Options.

Generamos un usuario IAM con las siguientes políticas solo para fines de prueba :

  • AmazonS3FullAccess
  • AmazonAthenaFullAccess

En un caso productivo tener en cuenta manejar el concepto de menor privilegio en los permisos del usuario IAM.

Si está habilitado la opción de LakeFormation en la cuenta de AWS, el permiso se tiene que dar desde Lake Formation al esquema y a las tablas respectivas que se desean leer desde PowerBI.

Clic en Ok.

Se generó el ODBC que tiene la conexión a Athena.

Entramos a Power BI.

Clic en Get data -> More …..

Clic en Other -> ODBC -> Connect

Nos saldrá la conexión que hemos configurado: ATHENA_CONEXION y clic en Ok.

Ingresamos los Access key y Secret Key:

Nos aparecerá la siguiente ventana:

Podemos ver una muestra de una tabla:

Seleccionamos la/las tabla/s del esquema correspondiente que deseamos analizar y clic en Load.

Gracias por leer hasta aquí. Si esta publicación te resultó útil, te agradecería mucho que la recomendaras (haciendo clic en el botón de aplaudir) para que otros también puedan encontrarla.

#aws #datalake #athena #powerbi

--

--