La base sigue estando en la diferencia ARM vs x86(x86-64).
Mientras el PC se basa en ser una bestia (y consumir a su vez más energía), ARM se basa en el "divide y vencerás" de minimizar todo a operaciones más sencillas (que necesitan menos potencia y consumo energético).
Así, una operación pc, pueden ser 4 opeaciones ARM.
Os pongo un ejemplo extraído de stack overflow:
Si en nuestra aplicación requerimos de algún tipo de comparación de bloques de memoria por bytes, en x86, sin código de compilador etc, sería:
repe cmpsb /* repeat while equal compare string bytewise *
Mientras en arm, la manera más breve (sin comprobación de errores ni nada) sería:
top: ldrb r2, [r0, #1]! /* load a byte from address in r0 into r2, increment r0 after */
ldrb r3, [r1, #1]! /* load a byte from address in r1 into r3, increment r1 after */
subs r2, r3, r2 /* subtract r2 from r3 and put result into r2 */
beq top /* branch(/jump) if result is zero */
Viendo esto, la propia Google nos indica que con ART, escrito completamente en 64bit, un procesador de 64bit podrá hacer aproximadamente el doble de operaciones que si estuviese funcionando en 32bit. Ojo: el mismo procesador trabajando a 32bit y trabajando a 64bit, no comparar un procesador X de 32 bit, o un procesador Y de 64bit.
Viendo que en nuestro caso de procesadores ARM, no nos importa tanto la potencia si no la cantidad de operaciones, esto es una gran ventaja.
Por esto es por lo que decía, que además de beneficiarnos en el direccionamiento de memoria (dado que con 64bit abrimos la veda a superar los 3GB), nos beneficiará en todo tipo de operaciones, se agilizarán todas las aperturas de aplicaciones, habrá más fluidez en cambio de pestañas del navegador, multitarea más efectiva..., etc.
Espero haber explicado más o menos por qué es beneficioso en dispositivos móviles 64bit (si el sistema operativo está preparado en 64bit también).