Painkiller:¿cómo llevarse 8 Millones de una tabla

a otra sin sufrir, en Ruby y cambiando types?

Codetails The Cocktail @carlossanchezp

Objetivo Codetails

Objetivos

¿cómo detectar problemas?
¿cómo resolverlos?
Ganar tiempo si te lo encuentras

El problema

Síntomas

Un select por índice es lento
Full scan de la tabla

Si ocurre esto es muy extraño, no es normal

Descubrir del problema

Cuidado!! con la obviedad, juega mala pasada, miramos pero no vemos
Con un "desc tabla" mysql
Un índice mal entendido como string
En Rails fk_id lo interpreta como integer
Full scan de la tabla

Un full scan no es un problema, es un síntoma de que necesitas índices

Herramienta de detección full scan

Explain extended

Posible Keys: lista de índices o NULL si no hay para buscar
Chosen Keys: nombre del índice a utilizar después de verificar todos los posibles y haber seleccionado el mejor
Rows scaned: el esfuerzo que necesita para cumplir la consulta

Explain extended

EXTRA column nos aporta más información
Using WHERE - FILESORT - TEMPORARY TABLE - INDEX

FILESORT: WHERE ID = 123 ORDER BY NAME

Using INDEX: COUNT SUM AVG

Explain extended

mysql> explain extended select * from users order by idusers desc limit 20 ;
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------+-------+
| id | select_type | table | type  | possible_keys | key     | key_len | ref  | rows | filtered  | Extra |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------+-------+
|  1 | SIMPLE      | users | index | NULL          | PRIMARY | 4       | NULL |   20 | 396545.00 |       |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-----------+-------+

 Filtered = 396.545 and total rows = 79.309

 The explain shows rows = 20 

 Filtered calculate = (Total Rows Table / 20)*100 = 396.545

¿Qué hace especial este codetails?

Importante

Solución en equipo
Todos hemos aportado

Trabajar en la Solución

Solución MIGRATE

Migrate con el cambio de fk_id de string a integer
método up del la migrate change_column tabla campo por integer

Ya tenemos la solución....... ¿de verdad lo crees así?

Espera infinita

Error de concepto

No tomar datos de partida
Envergadura del problema
Serio problema de deploy de horas

Todo lo probamos y medimos en local, después en muchos casos en Staging también

Analítica

Datos de partida

Tenemos aproximadamente 8Millones de tuplas
Tenemos índices sobre el campo a modificar
Migrar todos los datos menos los fk_id con datos innecesarios
Existen varios índices sobre la tabla

Solución Tarea

Utilizar AR para las lecturas en batch
Los insert de los datos en array
No utilizar AR para inserts
Un insert con X values a insertar mejor que X inserts con values
Sin incorporar "transaction" no aporta en un único insert con múltiples values por ciclo de batch

Primera decadencia

Problema

Siempre a los 100.000 registros
Problema: "Hemos perdido conexión con la BBDD"

Solución

Capturo la "exception"
Reconecto......pero no es la solución, ya no inserta más a partir de los 100.000 registros
Problema: "mysql server has gone away"

Investigación

Sistemas aporta max_allowed_packet y el fichero my.conf de MySQL.
Lectura por stackoverflow
Vuelta a analizar la situación

Pruebas

Tenemos un campo text
Sanitize
Tamaño del batch size para los Inserts, se va variando, 50.000, 25.000, 1.000........
Hacemos truncate del campo text sin resultado

Fracaso

Cambio de tercio en la solución

Cambio de concepto

OrderEvent.find_each(batch_size: 5000)
Preparar estrategia por select los order_id
Obtenemos los bloques a insertar
Podríamos aplicar un insert de los campos y un select con el where del order_id a tratar en cada ciclo
Tendríamos que saber los order_id que hemos insertado en la tabla nueva para no repetirlos
Ejecutamos un select previo al insert y verificamos sin utilizar AR ya que no hay modelo.

# SOLICIÓN 1
con_sql.execute "START TRANSACTION" if cont == 0
				
sql = "select order_id from order_events_new_origin where order_id = #{oe.order_id}"
result = con_sql.execute sql
if !inserts.include? oe.order_id
    puts "CREAMOS/MIGRAMOS en NUEVA TABLA Order ID #{oe.order_id} y el CONT #{cont}" 
    sql = "INSERT INTO order_events_new_origin
           (order_id,origin_type,origin_id,kind,data,created_at,updated_at) 

    SELECT order_id,origin_type,origin_id,kind,data,created_at,updated_at 
    FROM order_events where order_id = '#{oe.order_id}'"
    con_sql.execute sql
    cont = cont + 1
    inserts.push oe.order_id
end

Ventajas

Al pasar los campos directamente del Select e insertarlos directamente nos quitamos la problemática del "TEXT" y otros campos null

Resultado

El tiempo de proceso no juega mucho a nuestro favor, funciona y va bien pero no es demasiado rápido para como nos gustaría.

Volvemos al origen de la solución

Experiencia aprendia

Seguimos aplicando "Find each" con nuestro batch_size a jugar con el dato primero 5.000
Aparece problema conocido de "mysql server has gone away"
Vamos ajustando hasta llegar a 50
Vamos haciendo "Sanitize" no nos sirve los métodos de Rails de sanitize.
Sin "transaction" esto ya lo aplicamos en inicio en esta estrategia

 	# SOLUCIÓN 2
	# Vamos a sanitizar los campos antes de llevarlos al insert
	kind = oe.kind.nil? ? '' : oe.kind
	s = oe.data.nil? ? ''.inspect : oe.data.inspect

        # almacen de los values con sus datos ya sanitizados
	if oe.origin_id.nil?
		inserts_values.push "(#{oe.order_id.to_i}, 
                    '#{oe.origin_type}', null, 
                    '#{kind}', #{s}, '#{oe.created_at.to_s(:db)}', 
                    '#{oe.updated_at.to_s(:db)}')"
	else
		inserts_values.push "(#{oe.order_id.to_i}, 
                    '#{oe.origin_type}', #{oe.origin_id.to_i}, 
                    '#{kind}', #{s}, '#{oe.created_at.to_s(:db)}', 
                    '#{oe.updated_at.to_s(:db)}')"
	end
	    if inserts_values.size >= size_values
		sql_insert = "INSERT INTO #{table_destination} #{columns_origin} 
				  				VALUES #{inserts_values.join(", ")}"
		begin	
		    con_sql.execute sql_insert
		rescue Exception => e
		    puts "No lo guardamos ERROR #{e}" 
		end
	    inserts_values = []
	end

Resultados

Dada la ingesta de datos en los campos "Text" ajustamos el batch_size de AR a 50
Ajustamos los insert y values a 50 también ya que si no están ambos acompasados los resultados varian en 15 minutos adicionales en el proceso
Eliminamos los index antes de la migración, ralentiza la carga en 15 minutos aprox.
Resultados después de ajustes, satisfactorios

Conclusiones

El mejor resultado

Creamos la tabla a partir de la original
Modificamos el campo de string a entero
Eliminamos los index creados al copiar tabla y optimizamos el tiempo y evitamos que el árbol B-TREE del índice no sea dispar y mejor distribución.
Procesamos con un insert y 50 values en cada ciclo
Sin transaction por ser una única sentencia
Creamos los índices nuevamente con los nuevos datos, esto lleva 5 minutos en 2 índices.

Gracias a todos!!

¿Preguntas?

Codetails en TCK - 2016

By Carlos Sánchez Pérez

Codetails en TCK - 2016

@carlossanchezp

1,499

Carlos Sánchez Pérez

Currently working at @navandu_ COO, Co-founder at @leemurapp & @wearenominis exCTO @beruby_es. ExDev at @The_Cocktail & @aspgems

Painkiller:¿cómo llevarse 8 Millones de una tabla

a otra sin sufrir, en Ruby y cambiando types?

Objetivo Codetails

Objetivos

El problema

Síntomas

Descubrir del problema

Herramienta de detección full scan

Explain extended

Explain extended

Explain extended

¿Qué hace especial este codetails?

Importante

Trabajar en la Solución

Solución MIGRATE

Espera infinita

Error de concepto

Analítica

Datos de partida

Solución Tarea

Primera decadencia

Problema

Solución

Investigación

Pruebas

Fracaso

Cambio de tercio en la solución

Cambio de concepto

Ventajas

Resultado

Volvemos al origen de la solución

Experiencia aprendia

Resultados

Conclusiones

El mejor resultado

Gracias a todos!!

Codetails en TCK - 2016

More from Carlos Sánchez Pérez