fix on-policy data order

yumeng5 · yumeng5 · commit 2dcc4350f829 · 2024-08-22T16:06:04.000-04:00
diff --git a/on_policy_data_gen/decode.py b/on_policy_data_gen/decode.py
@@ -30,7 +30,7 @@
 
 train_dataset= load_dataset(data_dir, split='train_prefs')
 
-prompts = list(set(train_dataset['prompt']))
+prompts = sorted(list(set(train_dataset['prompt'])))
 
 conversations = [tokenizer.apply_chat_template([{'role': 'user', 'content': prompt}], tokenize=False, add_generation_prompt=True) for prompt in prompts]