dim_i, dim_o loss_mode opti_mode dim_sample initial_messup dim_i=2 dim_o=3 dim_i=20 dim_o=30 dim_i=200 dim_o=300 mix mse cos adam sgd 2^0 2^-2 2^-4 2^-6 2^-8 0.1 1.0 10 loss correct sign raw error