dim_i, dim_o loss_mode opti_mode dim_sample initial_messup dim_i=2 dim_o=3 dim_i=20 dim_o=30 dim_i=200 dim_o=300 mse cos dot (mse+cos)/2 (dot+cos)/2 adam sgd 2^0 2^-2 2^-4 2^-6 2^-8 0.1 1.0 10 loss correct sign error raw error