186 lines
12 KiB
Markdown
186 lines
12 KiB
Markdown
# Escribiendo y optimizando código en Go
|
|
|
|
Este documento describe las mejores prácticas para escribir código de alto rendimiento en Go.
|
|
|
|
Si bien se discutirán maneras de optimizar servicios individuales (almacenamiento en caché, etc.), el diseño de sistemas distribuidos de alto rendimiento está fuera del alcance de este trabajo. Ya existen textos detallados sobre monitorización y diseño de sistemas distribuidos. Dicho tema abarca un conjunto completamente diferente de investigación y concesiones en el diseño.
|
|
|
|
Todo el contenido está sujeto a licencia bajo CC-BY-SA.
|
|
|
|
Este libro está dividido en diferentes secciones:
|
|
|
|
1. Consejos básicos para escribir software que no sea lento.
|
|
* Temas básicos de Ciencias de la Computación
|
|
2. Consejos para escribir software eficiente.
|
|
* Secciones específicas de Go sobre cómo obtener lo mejor del lenguaje
|
|
3. Consejos avanzados para escribir *software realmente* eficiente
|
|
* Para cuando tu código optimizado no sea lo suficientemente eficiente.
|
|
|
|
Podemos resumir estas tres secciones como:
|
|
|
|
1. "Sé razonable"
|
|
2. "Sé deliberado"
|
|
3. "Sé peligroso"
|
|
|
|
# Cuándo y dónde optimizar
|
|
|
|
Escribo esta sección primero porque es el paso más importante. Deberías estar haciendo esto?
|
|
|
|
Toda optimización tiene un coste. Generalmente, este coste se expresa en términos de complejidad de código o carga cognitiva -- un código optimizado es rara vez más simple que una versión sin optimizar.
|
|
|
|
Pero hay otro aspecto que llamaré la economía de la optimización. Como programador, tu tiempo es valioso. Está el coste de oportunidad de otras cosas que podrías estar haciendo en tu proyecto, `bug` que podrías arreglar, mejoras que podrías agregar. Optimizar cosas es divertido, pero no siempre es la tarea correcta a hacer. El rendimiento de un programa es una característica, pero también lo es terminarlo y cuan correcto está hecho.
|
|
|
|
Escoge lo más importante en lo que debas trabajar. A veces esto no es una optimización del uso de CPU, sino una de experiencia de usuario. Algo tan simple como agregar una barra de progreso, o modificar una página para que sea más veloz ejecutando cálculos en segundo plano después de mostrarla.
|
|
|
|
Algunas veces esto será obvio: un informe que se genera cada hora y tarda 3 horas en completar es menos útil que uno que termina en menos de una hora.
|
|
|
|
Sólo porque algo sea fácil de optimizar no significa que valga la pena hacerlo. Ignorar lo simple es una estrategia de desarrollo válida.
|
|
|
|
Considera esto como optimizar *tu* tiempo.
|
|
|
|
Tú decides qué optimizar y cuándo optimizar. Puedes mover la manilla entre "Software Veloz" y "Desarrollo Rápido".
|
|
|
|
Las personas escuchan y repiten sin pensar que "la optimización prematura es la raíz de todo mal", pero ellos ignoran el contexto completo de la frase.
|
|
|
|
"Los Programadores gastan una enorme cantidad de tiempo pensando, o preocupandose, por la velocidad de las partes no críticas de sus programas, y estos intentos por ser más eficientes en realidad causan un gran impacto negativo cuando el mantenimiento o la depuración son considerados. Debemos olvidarnos de las pequeñas eficiencias, digamos el 97% del tiempo: la optimización prematura es la raíz de todo mal. Sin embargo, no deberíamos dejar pasar la oportunidad de optimizar en ese otro 3% crítico." -- Knuth
|
|
|
|
https://www.youtube.com/watch?time_continue=429&v=RT46MpK39rQ
|
|
|
|
- No ignores las optimizaciones fáciles
|
|
- Más conocimiento de algoritmos y estructuras de datos hacen que la optización sea más "fácil" u "obvia"
|
|
|
|
"Deberías optimizar tu código? Si, pero sólo si el problema es importante, el programa es genuinamente lento, y si hay alguna expectativa de que se puede mejorar mientras se mantenga la exactitud, robustez, y claridad" -- The Practice of Programming, Kernighan and Pike
|
|
|
|
La optimización prematura también puede afectarte al atarte a ciertas decisiones. El código final puede ser más difícil de modificar si los requerimientos cambian y más difícil de desechar (falacia de coste) si es necesario.
|
|
|
|
[La estimación de desempeño BitFunnel](http://bitfunnel.org/strangeloop) muestra datos que hacen este equilibrio más explícito. Imagina una plataforma de búsqueda hipotética que necesite 30.000 servidores en varios centros de datos. Estos servidores tienen un coste aproximado de $1.000 USD por año. Si duplicaras la velocidad del software, este cambio puede ahorrarle a la compañia $15M USD por año. Incluso un solo desarrollador trabajando un año completo para mejorar el rendimiento por solo 1% valdría la pena.
|
|
|
|
En la gran mayoría de casos, el tamaño y velocidad del programa no es el problema. La optimización más fácil es no hacerla. La segunda alternativa más fácil es simplemente comprar mejor hardware.
|
|
|
|
Cuando hayas decidido cambiar tu programa, sigue leyendo.
|
|
|
|
### Modificar los datos
|
|
|
|
Modificar los datos significa agregar o alterar la representación de los datos
|
|
que estas procesando. Desde el punto de vista del rendimiento, algunos de
|
|
estos acabaran cambiando la complejidad O() asociada a diferentes aspectos de
|
|
la estructura de datos.
|
|
|
|
Ideas para mejorar tu estructura de datos:
|
|
|
|
* Campos adicionales
|
|
|
|
El clásico ejemplo de esto es almacenar la longitud de una lista enlazada en un
|
|
campo en el nodo raíz. Mantenerla actualizada conlleva un poco más de trabajo,
|
|
pero consultar la longitud se convierte en un simple acceso a un campo en vez de una
|
|
búsqueda transversal con complejidad O(n). Tu estructura de datos puede presentar una
|
|
mejora similar: un poco de mantenimiento en algunas operaciones a cambio de
|
|
mejorar el rendimiento en un caso de uso común.
|
|
|
|
De manera similar, almacenar punteros a nodos frecuentemente utilizados en vez
|
|
de realizar búsquedas adicionales. Esto cubre cosas como el link "hacia atrás"
|
|
en una lista doblemente enlazada para hacer que la eliminación de nodos tenga una complejidad O(1).
|
|
Algunas listas de salto guardan un "puntero de búsqueda", donde almacenas un
|
|
puntero a donde recientemente estuviste en tu estructura de datos, bajo la
|
|
suposición de que es un buen punto de partida para la siguiente operación.
|
|
|
|
* Índices de búsqueda adicionales
|
|
|
|
La mayoría de las estructuras de datos están diseñadas para un único tipo de
|
|
consulta. Si necesitas dos tipos de consultas, disponer de una "vista"
|
|
adicional a tus datos puede ser una gran mejora. Por ejemplo, un set de
|
|
structs puede tener un ID primario (integer) que usas para buscar en un
|
|
slice, pero a veces necesitas buscar por un ID secundario (string). En lugar
|
|
de iterar sobre el slice, puedes mejorar tu estructura de datos con un mapa de
|
|
string a ID o directamente al struct en cuestión.
|
|
|
|
* Información adicional sobre los elementos
|
|
|
|
Por ejemplo, mantener un filtro de Bloom de todos los elementos que has
|
|
insertado puede permitirte retornar rápidamente "sin coincidencias" a las
|
|
búsquedas. Estos necesitan ser pequeños y rápidos para no abrumar el resto de
|
|
la estructura de datos. (Si una búsqueda en tu estructura de datos principal
|
|
es barata, el costo del filtro de Bloom superará cualquier ahorro.)
|
|
|
|
* Si las búsquedas son costosas, agrega una cache
|
|
|
|
A mayor escala, una cache interna o externa (como memcache) puede ayudar.
|
|
Puede ser excesivo para una única estructura de datos. Hablaremos más sobre
|
|
caches más adelante.
|
|
|
|
Este tipo de cambios son útiles cuando los datos que necesitan son baratos de
|
|
almacenar y fáciles de mantener actualizados.
|
|
|
|
Estos son todos ejemplos claros de "realizar menos trabajo" a nivel de
|
|
la estructura de datos. Todos cuestan espacio. La mayoría de las veces, si estás
|
|
optimizando para CPU, tu programa usará más memoria. Se trata del clásico [space-time trade-off](https://en.wikipedia.org/wiki/Space%E2%80%93time_tradeoff).
|
|
|
|
Si tu programa utiliza demasiada memoria, también es posible ir por el otro
|
|
camino. Reduce el uso de espacio a cambio de una mayor carga computacional. En
|
|
lugar de almacenar cosas, calcúlalas cada vez. También puedes comprimir los datos
|
|
en memoria y descomprimirlos cuando los necesites.
|
|
|
|
[Small Memory Software](http://smallmemory.com/book.html) es un libro disponible
|
|
online que cubre técnicas para reducir el espacio utilizado por tus programas.
|
|
Aunque fue originalmente escrito dirigído a desarrolladores de sistemas
|
|
embebidos, sus ideas son aplicables para programas en hardware moderno que
|
|
manejen gran cantidad de datos.
|
|
|
|
* Reorganiza tus datos
|
|
|
|
Elimina el padding. Remueve campos extra. Utiliza tipos de datos mas pequeños.
|
|
|
|
* Cambia a una estructura de datos más lenta
|
|
|
|
Estructuras de datos más simples frecuentemente presentan menores
|
|
requerimientos de memoria. Por ejemplo, cambiar una estructura tipo arbol con
|
|
uso extensivo de punteros a un slice y búsqueda lineal.
|
|
|
|
* Compresión a medida para tus datos
|
|
|
|
Los algoritmos de compresión dependen fuertemente de qué esté siendo comprimido. Lo mejor es
|
|
elegir uno que se ajuste a tus datos. Si tienes un []byte, entonces algo como snappy, gzip, lz4,
|
|
funciona bien. Para datos de punto flotante existe go-tsz para series temporales y fpc para datos
|
|
científicos. Se ha realizado mucha investigación sobre la compresión de integers, generalmente
|
|
para la obtención de datos en motores de búsqueda. Algunos ejemplos son delta encoding y variantes
|
|
o esquemas más complejos que involucran diferencias xor codificadas con el algoritmo de Huffman.
|
|
También puedes usar tu propio algoritmo optimizado exactamente para tus datos.
|
|
|
|
¿Necesitas inspeccionar los datos o pueden permanecer comprimidos? ¿Necesitas acceso aleatorio o
|
|
sólo streaming? Si necesitas acceso a entradas individuales pero no quieres descomprimirlo todo,
|
|
puedes comprimir los datos en pequeños bloques y mantener un índice que indique qué rangos de
|
|
entradas hay en cada bloque. El acceso a una única entrada solo requiere consultar el
|
|
índice y descomprimir ese bloque pequeño.
|
|
|
|
Si tus datos no estan sólo en memoria, sino que vas a escribirlos a disco, ¿qué sucede con la
|
|
migración o agregár o eliminár campos?. Estarás ahora lidiando simplemente con []byte en vez de
|
|
los convenientes tipos estructurados de Go, por lo que necesitaras hacer uso del paquete unsafe
|
|
y considerar opciones de serialización.
|
|
|
|
Hablaremos más sobre la disposición de datos más adelante.
|
|
|
|
Las computadoras modernas y la jerarquía de memoria hacen que el compromiso
|
|
entre memoria/espacio sea menos claro. Es muy fácil para las tablas de búsqueda estar
|
|
"lejos" en memoria (y por lo tanto ser costosas de acceder) haciendo que sea más rápido
|
|
simplemente recalcular un valor cada vez que se necesita.
|
|
|
|
Esto también significa que el benchmarking frecuentemente mostrará mejoras que no
|
|
aparecen en producción debido a la contención de cache (e.g., tablas de
|
|
búsqueda que estan en la cache del procesador durante el benchmarking pero
|
|
que siempre son purgadas cuando son utilizadas por un sistema real.)
|
|
El [Jump Hash paper](https://arxiv.org/pdf/1406.2294.pdf) de Google de hecho
|
|
abordó esto directamente, comparando la performance de caché con y sin problemas
|
|
de contención. (Ver gráficos 4 y 5 del artículo)
|
|
|
|
TODO: how to simulate a contended cache, show incremental cost
|
|
|
|
Otro aspecto a considerar es el tiempo de transmisión de datos. Generalmente el
|
|
acceso a disco y de red es muy lento, y por lo tanto ser capaz de cargar un
|
|
bloque comprimido va a resultar en un proceso mucho más rápido incluso teniendo
|
|
en cuenta el tiempo que lleva descomprimirlo. Como siempre, realiza benchmarks.
|
|
Un formato binario generalmente va a ser mas liviano y rápido de parsear que uno
|
|
de texto, pero el coste es que no será legible para un humano.
|
|
|
|
Para la transferencia de datos, cambia a un protocol menos verboso, o
|
|
mejora el API para aceptar consultas parciales. Por ejemplo, usa una consulta
|
|
incremental en lugar de forzar a traer siempre el set de datos completo.
|