Migración de datos a través de BigQuery y Google Cloud

Amarello_DW_Blog-6-Consideración

Tiempo de lectura 5 minutos

La necesidad de contar como aliada a toda la información que se genera en sus áreas ha llevado a las empresas a implementar diversas estrategias de migración de datos. El almacenamiento en la nube es una de las mejores soluciones, pero su éxito depende de que se mantenga alineado a los objetivos de la organización y se realice un proyecto a la medida. Con BigQuery, una de las armas secretas de Google Cloud, esa meta será alcanzable a través de diversas herramientas que harán todo más sencillo, ágil y predictivo. 

Acompáñanos a descubrir por qué BigQuery es tan efectivo.

Migración de datos: la oportunidad para crecer como empresa

Una estrategia de migración de datos no es una tarea fácil, ya que requiere tiempo, energía y esfuerzo, pero los resultados finales harán que todo valga la pena. Las empresas que lo están ejecutando a través de las soluciones de Google Cloud como BigQuery pueden aprovechar la transición para cavilar, considerar y reconstruir lo necesario en busca de cumplir sus objetivos.

Keybank: una empresa Data Driven a través de Google Cloud

Un caso de éxito de esta combinación es Keybank, una institución financiera regional con más de 1,000 sucursales que administran más de $145 mil millones en activos. Cuando estaba a punto de finalizar el servicio de su proveedor de almacenamiento de datos, decidió que Google Cloud Platform era la opción adecuada para la naturaleza dinámica y sensible a la seguridad del negocio. El entorno que encontró con Google era elástico, rápido y coherente para la cantidad de Data.

Te puede interesar: Big Data: El mejor aliado para saber qué ocurre en tu negocio

El objetivo de Keybank no se limitaba a cambiar su Teradata Warehouse a Google Cloud, sino que tomaron la migración de datos para reinventar los viejos procesos y las formas tradicionales de hacer banca. Aprovecharon los clústeres de Python y Spark para desarrollar un nuevo modelo que les permitiera anticiparse a los intentos de fraude en depósitos de cheques a través de algoritmos basados en la data.

Una mejor experiencia de uso de la nube

BigQuery ofrece un efectivo proceso de migración de datos con soluciones personalizables y años de experiencia en la nube. Se trata de una plataforma abierta y flexible. Las fases en las que se divide su proceso son esenciales para alcanzar el éxito esperado y por ello las debes conocer.

Etapas de la migración de datos a través de BigQuery

  • Evaluación
  • Traducción de SQL
  • Validación de datos

Evaluación: Planifica y gestiona los riesgos y costos de la migración

Con una buena evaluación, planificar y gestionar los riesgos y costos de la migración es más sencillo y efectivo. El informe con los resultados ayuda a tener una comprensión clara de todos los componentes y la cantidad de trabajo que serán requeridos para ejecutar una migración de datos. Además, proporciona una manera fácil y automatizada de recopilar estadísticas de un almacén heredado. De esta forma, se logra saber qué funciona y qué no.

En la evaluación, lo ideal es catalogar casos prácticos existentes y nuevos, así se podrá asignarles una prioridad y definir medidas claras de éxito a través de indicadores clave de rendimiento (KPI). Es importante generar estimaciones de tiempo realistas, así como la disponibilidad y alcance de todas las partes interesadas relevantes a fin acordar su nivel de participación durante el proyecto. Esto te ayudará a estimar los costos laborales con mayor precisión.

Lee también: Big Data en la nube: ¿En qué etapa se encuentra tu empresa?

Un proveedor de las herramientas de Google Cloud, como es el caso de Amarello, usa la evaluación para crear un plan de migración personalizado. Uno que conduzca a un TCO reducido y traslados de menor riesgo. Ejecutar una estrategia de migración de datos con BigQuery abre la oportunidad para que una empresa mejore su ecosistema, sus requisitos y sus objetivos comerciales. Se trata de una solución integral que incluye herramientas gratuitas para cada fase del proyecto.

Traducción de SQL: Reduce el esfuerzo manual, el tiempo y los errores

Dentro de los puntos clave en la migración de datos, la modernización de una lógica empresarial heredada, como consultas SQL, scripts y procedimientos almacenados, tiene una gran importancia. Aquí normalmente se recurre a reescrituras y verificaciones de búsquedas manuales sustanciales, las cuales llevan mucho tiempo y son propensas a errores. Para este caso, BigQuery se presenta como una buena alternativa al ofrecer una traducción SQL interactiva y por lotes que te ayudarán a automatizar gran parte de este proceso, acelerando así su camino hacia una migración exitosa. 

Traducción por lotes

Es parte del servicio de migración de BigQuery y permite la interpretación de otros dialectos de SQL al SQL estándar de la herramienta de Google Cloud. También puedes transcribir lenguajes de programación de SQL como la consulta básica de Teradata (BTEQ). 

Traducción interactiva de SQL

Se ejecuta directamente desde el espacio de BigQuery, proporciona una herramienta que puede reducir el tiempo y el esfuerzo para migrar cargas de trabajo de SQL.

En ambos casos, se proporcionan procesos rápidos, semánticamente correctos y legibles para humanos. Admiten una amplia gama de artefactos de Teradata, incluidos DML, DDL y BTEQ. Las empresas que han utilizado la traducción de SQL han visto aproximadamente el 95% de las interpretaciones exitosas en más de 10 millones de consultas, dejando sólo el 5% restante para revisión manual con sus socios de migración.

Validación de datos: Verifica la exactitud de los datos

En esta etapa de los proyectos de migración de almacenamiento, se comparan tanto los datos estructurados como los semiestructurados del origen y el destino para garantizar que coincidan y sean correctos después de cada paso de migración. El instrumento de validación de datos (DVT) de GCP es una herramienta CLI de Python de código abierto y está basado en el framework Ibis que compara tablas de fuentes de datos heterogéneas con funciones de validación de varios niveles personalizables para comparar tablas de origen y de destino a nivel de tabla, columna y fila. 

Revisa ahora: Conoce las 7 V’s del Big Data

También es flexible, lo que significa que las nuevas reglas de validación se pueden conectar fácilmente como mejor le parezca. Además, para facilitar la automatización, la orquestación y la programación, también se puede integrar con Cloud Functions, Cloud Run y ​​Composer para una validación recurrente.

Los servicios de migración de datos de BigQuery son personalizables

Si bien realizar una migración de datos puede ser una tarea compleja y prolongada, con BigQuery Migration Service el panorama es distinto, ya que a través de las distintas etapas del proceso se logrará crear una estrategia a la medida, simplificando y eliminando los riesgos. En Amarello, como proveedores de las herramientas de Google Cloud, ofrecemos la solución que cada empresa necesita para modernizar su almacén de datos con BigQuery. Acércate a nosotros y permite que encontremos el proyecto adecuado.

Leave a Comment