Quantization
TécnicasReducir la precisión numérica de los pesos (ej: de float32 a int8) para hacer modelos más pequeños y rápidos.
Conceptos relacionados:
2 términos que empiezan por "Q"
Reducir la precisión numérica de los pesos (ej: de float32 a int8) para hacer modelos más pequeños y rápidos.
Tarea de responder preguntas basándose en un contexto o conocimiento general. Puede ser extractiva o generativa.