Implementation notes: armeabi, cubie2, crypto_scalarmult/curve25519

Computer: cubie2
Architecture: armeabi
CPU ID: unknown CPU ID
SUPERCOP version: 20161026
Operation: crypto_scalarmult
Primitive: curve25519

Time	Implementation	Compiler	Benchmark date	SUPERCOP version
3714994	`neon2`	`gcc -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
3715033	`neon2`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
3715125	`neon2`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
3715132	`neon2`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026
3715320	`neon2`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026
3715383	`neon2`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
5708264	`ref10`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
5984802	`ref10`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026
5991734	`ref10`	`gcc -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
6050114	`ref10`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
6147450	`ref10`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
6164348	`ref10`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026
71155494	`ref`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
72228681	`ref`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026
78178874	`ref`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O3`	20161226	20161026
82274604	`ref`	`gcc -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
82675656	`ref`	`gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -Os`	20161226	20161026
85107371	`ref`	`gcc -mcpu=native -mfpu=neon-vfpv4 -O2`	20161226	20161026

Compiler output

Implementation: crypto_scalarmult/curve25519/donna_c64
Compiler: gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O2

smult.c: smult.c:34:1: error: unable to emulate 'TI'
smult.c: typedef unsigned uint128_t __attribute__((mode(TI)));
smult.c: ^~~~~~~
smult.c: smult.c: In function 'fscalar_product':
smult.c: smult.c:76:49: warning: right shift count >gt;= width of type [-Wshift-count-overflow]
smult.c: a = ((uint128_t) in[1]) * scalar + ((limb) (a >gt;>gt; 51));
smult.c: ^~
smult.c: smult.c:79:49: warning: right shift count >gt;= width of type [-Wshift-count-overflow]
smult.c: a = ((uint128_t) in[2]) * scalar + ((limb) (a >gt;>gt; 51));
smult.c: ^~
smult.c: ...
smult.c: ^~~~
smult.c: smult.c:70:1: warning: always_inline function might not be inlinable [-Wattributes]
smult.c: fscalar_product(felem output, const felem in, const limb scalar) {
smult.c: ^~~~~~~~~~~~~~~
smult.c: smult.c:56:1: warning: always_inline function might not be inlinable [-Wattributes]
smult.c: fdifference_backwards(felem out, const felem in) {
smult.c: ^~~~~~~~~~~~~~~~~~~~~
smult.c: smult.c:41:1: warning: always_inline function might not be inlinable [-Wattributes]
smult.c: fsum(limb *output, const limb *in) {
smult.c: ^~~~

Number of similar (compiler,implementation) pairs: 6, namely:

Compiler	Implementations
gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O2	donna_c64
gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -O3	donna_c64
gcc -funroll-loops -mcpu=native -mfpu=neon-vfpv4 -Os	donna_c64
gcc -mcpu=native -mfpu=neon-vfpv4 -O2	donna_c64
gcc -mcpu=native -mfpu=neon-vfpv4 -O3	donna_c64
gcc -mcpu=native -mfpu=neon-vfpv4 -Os	donna_c64