1.myTestRLExample1_simple1_DQN.m,训练采用DQN,简单网络,输入只有转角,训练失败
2.myTestRLExample1_simple1.m,训练采用DPPG,简单网络,输入只有转角。训练失败
3.myRLExample1.m,用于DPPG网络,输出类别不同。加入提前终止规则(有用),训练失败
4.myRLExample1_DQN.m,用于DQN网络,输出类别不同。训练失败
5.myTestRLExample2.m,用于DPPG网络,输入有转角和加速度
6.myTestRLExample2_simple1.m,用于DPPG网络,简单网络,输入有转角和加速度
7.myTestRLExample1_complex1.m.用于DPPG网络,复杂网络,输入只有有转角(成功) ,失败