Fixed argparser in run.py

DeepLearning VM · DeepLearning VM · commit b63d97c5466a · 2020-02-03T01:48:31.000Z
diff --git a/run.py b/run.py
@@ -8,12 +8,30 @@
 from preprocess import PreprocessingPipeline
 from train import train
 from model import MusicTransformer
+import argparse
 
 def main():
+    parser = argparse.ArgumentParser("Script to train model on a GPU")
+    parser.add_argument("--checkpoint", type=str, default=None,
+            help="Optional path to saved model, if none provided, the model is trained from scratch.")
+    parser.add_argument("--n_epochs", type=int, default=5,
+            help="Number of training epochs.")
+    args = parser.parse_args()
+    
     sampling_rate = 125
     n_velocity_bins = 32
     seq_length = 1024
+    n_tokens = 256 + sampling_rate + n_velocity_bins
+    transformer = MusicTransformer(n_tokens, seq_length, 
+            d_model = 64, n_heads = 8, d_feedforward=256, 
+            depth = 4, positional_encoding=True, relative_pos=True)
+
+    if args.checkpoint is not None:
+        state = torch.load(args.checkpoint)
+        transformer.load_state_dict(state)
+        print(f"Successfully loaded checkpoint at {args.checkpoint}")
     #rule of thumb: 1 minute is roughly 2k tokens
+    
     pipeline = PreprocessingPipeline(input_dir="data", stretch_factors=[0.975, 1, 1.025],
             split_size=30, sampling_rate=sampling_rate, n_velocity_bins=n_velocity_bins,
             transpositions=range(-2,3), training_val_split=0.9, max_encoded_length=seq_length+1,
@@ -28,15 +46,14 @@ def main():
 
     training_sequences = pipeline.encoded_sequences['training']
     validation_sequences = pipeline.encoded_sequences['validation']
-    n_tokens = 256 + 125 + 32
     
     batch_size = 16
-    transformer = MusicTransformer(n_tokens, seq_length, d_model = 64, n_heads = 8, 
-        d_feedforward=256, depth = 4, positional_encoding=True, relative_pos=True)
     
     train(transformer, training_sequences, validation_sequences,
-               epochs = 5, evaluate_per = 1,
+               epochs = args.n_epochs, evaluate_per = 1,
                batch_size = batch_size, batches_per_print=100,
                padding_index=0, checkpoint_path=checkpoint)
 
 
+if __name__=="__main__":
+    main()